基于非对称孪生蒸馏编码的领域多模态神经机器翻译方法

AITNT
正文
推荐专利
基于非对称孪生蒸馏编码的领域多模态神经机器翻译方法
申请号:CN202510506627
申请日期:2025-04-22
公开号:CN120337949A
公开日期:2025-07-18
类型:发明专利
摘要
本发明提出了基于非对称孪生蒸馏编码的领域多模态神经机器翻译方法,以模态无关的领域枢纽的优越性集成稀疏的领域视觉细节和文本。本发明首先获取源句子和与源句子最相关的图像;然后构建非对称孪生文本编码器,分别捕捉文本和领域导向的多模态语义,并缩小图像‑文本数据对之间的模态差距,并同时将领域导向的视觉细节集成到文本中;接着使用跨模态领域掩码机制来获取领域特定知识;最后,通过基于领域概率采样的领域自适应蒸馏策略,逐步将特定领域的视觉细节蒸馏到文本中;本发明解决特定领域的机器翻译问题,旨在拉进模态之间的差距,并解决跨模态语义稀疏映射问题来促进领域文本的机器翻译性能。
技术关键词
神经机器翻译方法 文本编码器 视觉 蒸馏 多头注意力机制 前馈神经网络 开源框架 融合多模态特征 跨模态 图像 解码器框架 图文 编码器模块 掩码矩阵
系统为您推荐了相关专利信息
1
一种大尺度双目视觉测量相机焦距校准方法及系统
焦距校准方法 表达式 坐标 标定方法 校准系统
2
区域信息估算方法及系统及非暂态电脑可读取存储介质
监控装置 估算系统 影像 密度 卷积类神经网络
3
交互方法、装置、设备和存储介质
虚拟对象 场景 界面 画面 交互方法
4
基于牙齿图像的龋齿识别分析预警方法及系统
分析预警方法 风险 生成用户 牙菌斑 标记
5
一种抓取装置和视觉检测设备
抓取装置 抓取组件 调节滑座 解锁杆 驱动组件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号