融合图像信息的多模态蒙汉神经机器翻译方法

正文

推荐专利

申请号：CN202411556002

申请日期：2024-11-04

公开号：CN119808796A

公开日期：2025-04-11

类型：发明专利

摘要

发明提出了一种融合图像信息的多模态蒙汉神经机器翻译方法，训练得到一个蒙古语文本生成图像模型，输入源句子到蒙古语文本生成图像模型中生成对应的语义图像，在翻译过程中，将源句子输入编码器得到源句子的表示形式HL，并使用注意力机制将图像表示融合到源句子得到源表示将源表示输入到解码器以计算得到解码器用于预测目标翻译的依赖时间上下文向量，最终输出汉语文本。本发明融合图像信息来构建基于多模态的编码器‑解码器框架，结合有蒙语描述的句子‑图像对，能够更好地利用图像信息和句子的语义信息，有效提高蒙汉神经机器翻译的译文流利度和翻译质量。

技术关键词

蒙汉神经机器翻译方法文本生成图像蒙古语融合图像信息图像转换方法注意力机制生成对抗网路中文分词工具双语语料库多模态主题解码器框架前馈神经网络查找表语义文本编码器

系统为您推荐了相关专利信息

基于增强生成对抗网络的可见光图像到红外图像转换方法

可见光图像图像转换方法生成对抗网络误差方法双编码器

一种基于场景图的多对象文本生成图像语义评测方法和系统

图像对象特征文本生成图像语义评测方法关系多模态

面向数字图书馆的多模态智能检索方法及系统

面向数字图书馆智能检索方法资源绑定结构语义向量

一种基于孪生-词级判别器的文本生成图像方法

文本生成图像方法视觉特征文本编码器图像编码器上下文特征

基于DLb-YOLOv8的火焰语义分割方法

语义分割方法融合图像信息解码器结构图片卷积模块

融合图像信息的多模态蒙汉神经机器翻译方法

站点导航

APP 下载