融合多模态细粒度信息的视频机器翻译方法及装置

正文

推荐专利

申请号：CN202510043829

申请日期：2025-01-10

公开号：CN119996762A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供一种融合多模态细粒度信息的视频机器翻译方法及装置。该融合多模态细粒度信息的视频机器翻译方法应包括：对视频中的画面进行信息抽取，得到所述画面中的细粒度视觉信息，并对所述视频中的音频进行信息抽取，得到所述音频中的细粒度音频信息；将所述细粒度视觉信息与所述细粒度音频信息融合到源文本中，得到融合文本；所述源文本为所述视频中的待翻译字幕；将所述融合文本输入到机器翻译模型中得到目标翻译文本。本发明提供的融合多模态细粒度信息的视频机器翻译方法及装置，通过将视频的细粒度视觉信息和细粒度音频信息融合进源文本中，基于融合文本进行机器翻译，提高了翻译的准确性。

技术关键词

机器翻译方法多模态机器翻译模型文本视频画面翻译字幕音频非暂态计算机可读存储介质标签视觉机器翻译装置语音处理器计算机程序产品地点实体存储器

系统为您推荐了相关专利信息

一种麻醉深度多模态数据的特征融合处理方法

图形化特征多模态生理电信号指数模式匹配

一种视频直播违规的快速抓取方法、设备和介质

抓取方法语音识别文本指数风险词语

基于单目视觉的目标测距测速方法

测距测速方法头单元小孔成像原理多模态方式高层语义特征

一种基于概念化表征的文本语义计算与认知投入评测方法

概念评测方法文本语义相关度在线

一种非健康状态神经信号向健康状态神经信号对齐的方法

三维重建图像信号电极异常声音血管

融合多模态细粒度信息的视频机器翻译方法及装置

站点导航

APP 下载