融合图像信息的多模态蒙汉神经机器翻译方法

AITNT
正文
推荐专利
融合图像信息的多模态蒙汉神经机器翻译方法
申请号:CN202411556002
申请日期:2024-11-04
公开号:CN119808796A
公开日期:2025-04-11
类型:发明专利
摘要
发明提出了一种融合图像信息的多模态蒙汉神经机器翻译方法,训练得到一个蒙古语文本生成图像模型,输入源句子到蒙古语文本生成图像模型中生成对应的语义图像,在翻译过程中,将源句子输入编码器得到源句子的表示形式HL,并使用注意力机制将图像表示融合到源句子得到源表示将源表示输入到解码器以计算得到解码器用于预测目标翻译的依赖时间上下文向量,最终输出汉语文本。本发明融合图像信息来构建基于多模态的编码器‑解码器框架,结合有蒙语描述的句子‑图像对,能够更好地利用图像信息和句子的语义信息,有效提高蒙汉神经机器翻译的译文流利度和翻译质量。
技术关键词
蒙汉神经机器翻译方法 文本生成图像 蒙古语 融合图像信息 图像转换方法 注意力机制 生成对抗网路 中文分词工具 双语语料库 多模态 主题 解码器框架 前馈神经网络 查找表 语义 文本编码器
系统为您推荐了相关专利信息
1
基于增强生成对抗网络的可见光图像到红外图像转换方法
可见光图像 图像转换方法 生成对抗网络 误差方法 双编码器
2
一种基于场景图的多对象文本生成图像语义评测方法和系统
图像对象特征 文本生成图像 语义评测方法 关系 多模态
3
面向数字图书馆的多模态智能检索方法及系统
面向数字图书馆 智能检索方法 资源 绑定结构 语义向量
4
一种基于孪生-词级判别器的文本生成图像方法
文本生成图像方法 视觉特征 文本编码器 图像编码器 上下文特征
5
基于DLb-YOLOv8的火焰语义分割方法
语义分割方法 融合图像信息 解码器结构 图片 卷积模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号