一种基于视觉幻想引导进行场景自适应的多模态神经机器翻译方法

正文

推荐专利

申请号：CN202411708419

申请日期：2024-11-26

公开号：CN119578434B

公开日期：2025-12-19

类型：发明专利

摘要

本发明提出一种基于视觉幻想引导进行场景自适应的多模态神经机器翻译方法，通过利用视觉幻想为引导融合不同模态特征以及不断减小模态间差异，实现场景自适应的翻译功能。本发明通过引入一种非对称交替更新策略，以缩小模态差距并提高多模态数据的表征能力。最后，建立跨模态自适应融合机制来对两种模态进行有效融合。本发明能有效提升模型在复杂多变的图像‑文本环境中的多模态表征学习能力，确保其在推理阶段，即便面临嘈杂数据或纯文本场景，依然能够维持较高的机器翻译性能。本发明在大多数集合上都达到了优于其他现有技术的最优分数，证明了其在多种场景，尤其是噪声环境下，所展现出的杰出稳定性和一致性，有力地提升了机器翻译的性能。

技术关键词

神经机器翻译方法场景视觉特征开源系统文本生成图像机器翻译模型跨模态多模态特征数据融合方法更新方法注意力机制编码

系统为您推荐了相关专利信息

大模型恢复训练的方法及装置、存储介质及电子装置

节点数据并行策略参数模型更新优化器

基于“智慧眼”策略的工地安全预警方法

预警方法工地图片策略 BERT模型

道路场景的目标检测方法、设备、程序产品以及存储介质

深度值解码网络点云特征提取人工智能处理器云数据中心

一种基于配电数据反馈的输电线路智能管控方法及系统

线损输电线路智能耦合特征历史气象数据动态

一种集成核酸抽提与扩增检测的微流控芯片

核酸提取密封腔通道微流控芯片密封薄膜

一种基于视觉幻想引导进行场景自适应的多模态神经机器翻译方法

站点导航

APP 下载