融合多模态细粒度信息的视频机器翻译方法及装置

AITNT
正文
推荐专利
融合多模态细粒度信息的视频机器翻译方法及装置
申请号:CN202510043829
申请日期:2025-01-10
公开号:CN119996762A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供一种融合多模态细粒度信息的视频机器翻译方法及装置。该融合多模态细粒度信息的视频机器翻译方法应包括:对视频中的画面进行信息抽取,得到所述画面中的细粒度视觉信息,并对所述视频中的音频进行信息抽取,得到所述音频中的细粒度音频信息;将所述细粒度视觉信息与所述细粒度音频信息融合到源文本中,得到融合文本;所述源文本为所述视频中的待翻译字幕;将所述融合文本输入到机器翻译模型中得到目标翻译文本。本发明提供的融合多模态细粒度信息的视频机器翻译方法及装置,通过将视频的细粒度视觉信息和细粒度音频信息融合进源文本中,基于融合文本进行机器翻译,提高了翻译的准确性。
技术关键词
机器翻译方法 多模态 机器翻译模型 文本 视频 画面 翻译字幕 音频 非暂态计算机可读存储介质 标签 视觉 机器翻译装置 语音 处理器 计算机程序产品 地点 实体 存储器
系统为您推荐了相关专利信息
1
一种麻醉深度多模态数据的特征融合处理方法
图形化特征 多模态生理 电信号 指数 模式匹配
2
一种视频直播违规的快速抓取方法、设备和介质
抓取方法 语音识别文本 指数 风险 词语
3
基于单目视觉的目标测距测速方法
测距测速方法 头单元 小孔成像原理 多模态方式 高层语义特征
4
一种基于概念化表征的文本语义计算与认知投入评测方法
概念 评测方法 文本 语义相关度 在线
5
一种非健康状态神经信号向健康状态神经信号对齐的方法
三维重建图像 信号 电极 异常声音 血管
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号