基于多模态交互的翻译方法和系统

AITNT
正文
推荐专利
基于多模态交互的翻译方法和系统
申请号:CN202510134220
申请日期:2025-02-07
公开号:CN119990159B
公开日期:2025-08-12
类型:发明专利
摘要
本发明涉及机器翻译技术领域,具体为基于多模态交互的翻译方法和系统,一方面,当存在文本模态时,根据是否存在文本模态的音频模态来分别执行不同的操作;其中,当存在音频模态时,将音频模态翻译为文本向量后与文本模态对应向量进行融合;当不存在音频模态时,将文本模态进行初步翻译后再与文本模态对应向量进行拼接,并进行时序语义分析;另一方面,当不存在文本模态时,将音频模态或/和图像模态翻译为文本向量;最后,将上述特征提取得到的音频文本融合特征向量、或文本时序特征向量、或第二音频仿文本向量、或图像仿文本向量、或融合仿文本向量通过机器翻译处理,得到更为准确的翻译结果,实现机器翻译的全面性、灵活性、适应性和准确性。
技术关键词
文本 多模态交互 翻译方法 语音信号特征 音频特征 图像增强 语音特征提取 特征提取模块 时序 序列 融合特征 上下文特征 声学特征 语义 机器翻译技术 信息熵 翻译设备
系统为您推荐了相关专利信息
1
基于大型语言模型的图像分割方法、装置、电子设备
图像分割方法 射线 文本 视觉 非暂态计算机可读存储介质
2
基于鱼眼视觉与SEEM-YOLO级联架构的动态库位状态监测方法
鱼眼相机 生成感兴趣区域 文本特征向量 状态监测方法 图像
3
一种基于多元知识分析的操作票人员资质标准制定方法
节点 关系 弱标注数据 知识图谱构建 词典
4
一种基于文本驱动和注意力机制的3D形状分割方法及系统
形状分割方法 注意力机制 拉普拉斯 文本 融合特征
5
一种组合零样本图像分类及模型的训练方法和装置
基元 神经网络模型 零样本图像分类 训练集 分支
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号