一种基于视觉幻想引导进行场景自适应的多模态神经机器翻译方法

AITNT
正文
推荐专利
一种基于视觉幻想引导进行场景自适应的多模态神经机器翻译方法
申请号:CN202411708419
申请日期:2024-11-26
公开号:CN119578434B
公开日期:2025-12-19
类型:发明专利
摘要
本发明提出一种基于视觉幻想引导进行场景自适应的多模态神经机器翻译方法,通过利用视觉幻想为引导融合不同模态特征以及不断减小模态间差异,实现场景自适应的翻译功能。本发明通过引入一种非对称交替更新策略,以缩小模态差距并提高多模态数据的表征能力。最后,建立跨模态自适应融合机制来对两种模态进行有效融合。本发明能有效提升模型在复杂多变的图像‑文本环境中的多模态表征学习能力,确保其在推理阶段,即便面临嘈杂数据或纯文本场景,依然能够维持较高的机器翻译性能。本发明在大多数集合上都达到了优于其他现有技术的最优分数,证明了其在多种场景,尤其是噪声环境下,所展现出的杰出稳定性和一致性,有力地提升了机器翻译的性能。
技术关键词
神经机器翻译方法 场景 视觉特征 开源系统 文本生成图像 机器翻译模型 跨模态 多模态特征 数据 融合方法 更新方法 注意力机制 编码
系统为您推荐了相关专利信息
1
大模型恢复训练的方法及装置、存储介质及电子装置
节点 数据并行策略 参数 模型更新 优化器
2
基于“智慧眼”策略的工地安全预警方法
预警方法 工地 图片 策略 BERT模型
3
道路场景的目标检测方法、设备、程序产品以及存储介质
深度值 解码网络 点云特征提取 人工智能处理器 云数据中心
4
一种基于配电数据反馈的输电线路智能管控方法及系统
线损 输电线路智能 耦合特征 历史气象数据 动态
5
一种集成核酸抽提与扩增检测的微流控芯片
核酸提取 密封腔 通道 微流控芯片 密封薄膜
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号