摘要
本发明涉及基于细粒度对比学习的越南语文本图像翻译方法,属于自然语言处理领域。越南语文本包含大量带有声调和变音符号的字符,为了解决越南语图像中相似字符翻译准确率低的问题,提出一种基于细粒度对比学习的越南语文本图像翻译方法,主要由越南语文本图像翻译数据集构建及预处理、设计包括基于端到端的文本图像机器翻译模块、辅助机器翻译任务模块、细粒度对比学习模块的基于细粒度对比学习的越南语文本图像翻译模型以及越南语文本图像翻译四个部分构成。本发明提出的方法在越南语文本图像翻译任务中表现优异,并且在低质量图像的场景下翻译的准确率也有明显提升。
技术关键词
图像翻译方法
机器翻译
解码器
图像编码器
序列特征
双向长短期记忆网络
薄板样条插值
文本编码器
空间变换网络
翻译模型
视觉特征
模块
图像翻译系统
样本
非暂态计算机可读存储介质
残差网络
平行语料库
图文