基于非对称孪生蒸馏编码的领域多模态神经机器翻译方法

正文

推荐专利

申请号：CN202510506627

申请日期：2025-04-22

公开号：CN120337949A

公开日期：2025-07-18

类型：发明专利

摘要

本发明提出了基于非对称孪生蒸馏编码的领域多模态神经机器翻译方法，以模态无关的领域枢纽的优越性集成稀疏的领域视觉细节和文本。本发明首先获取源句子和与源句子最相关的图像；然后构建非对称孪生文本编码器，分别捕捉文本和领域导向的多模态语义，并缩小图像‑文本数据对之间的模态差距，并同时将领域导向的视觉细节集成到文本中；接着使用跨模态领域掩码机制来获取领域特定知识；最后，通过基于领域概率采样的领域自适应蒸馏策略，逐步将特定领域的视觉细节蒸馏到文本中；本发明解决特定领域的机器翻译问题，旨在拉进模态之间的差距，并解决跨模态语义稀疏映射问题来促进领域文本的机器翻译性能。

技术关键词

神经机器翻译方法文本编码器视觉蒸馏多头注意力机制前馈神经网络开源框架融合多模态特征跨模态图像解码器框架图文编码器模块掩码矩阵

系统为您推荐了相关专利信息

一种大尺度双目视觉测量相机焦距校准方法及系统

焦距校准方法表达式坐标标定方法校准系统

区域信息估算方法及系统及非暂态电脑可读取存储介质

监控装置估算系统影像密度卷积类神经网络

交互方法、装置、设备和存储介质

虚拟对象场景界面画面交互方法

基于牙齿图像的龋齿识别分析预警方法及系统

分析预警方法风险生成用户牙菌斑标记

一种抓取装置和视觉检测设备

抓取装置抓取组件调节滑座解锁杆驱动组件

基于非对称孪生蒸馏编码的领域多模态神经机器翻译方法

站点导航

APP 下载