摘要
发明提出了一种融合图像信息的多模态蒙汉神经机器翻译方法,训练得到一个蒙古语文本生成图像模型,输入源句子到蒙古语文本生成图像模型中生成对应的语义图像,在翻译过程中,将源句子输入编码器得到源句子的表示形式HL,并使用注意力机制将图像表示融合到源句子得到源表示将源表示输入到解码器以计算得到解码器用于预测目标翻译的依赖时间上下文向量,最终输出汉语文本。本发明融合图像信息来构建基于多模态的编码器‑解码器框架,结合有蒙语描述的句子‑图像对,能够更好地利用图像信息和句子的语义信息,有效提高蒙汉神经机器翻译的译文流利度和翻译质量。
技术关键词
蒙汉神经机器翻译方法
文本生成图像
蒙古语
融合图像信息
图像转换方法
注意力机制
生成对抗网路
中文分词工具
双语语料库
多模态
主题
解码器框架
前馈神经网络
查找表
语义
文本编码器
系统为您推荐了相关专利信息
可见光图像
图像转换方法
生成对抗网络
误差方法
双编码器
图像对象特征
文本生成图像
语义评测方法
关系
多模态
面向数字图书馆
智能检索方法
资源
绑定结构
语义向量
文本生成图像方法
视觉特征
文本编码器
图像编码器
上下文特征
语义分割方法
融合图像信息
解码器结构
图片
卷积模块