基于多模态交互的翻译方法和系统

正文

推荐专利

基于多模态交互的翻译方法和系统

申请号：CN202510134220

申请日期：2025-02-07

公开号：CN119990159B

公开日期：2025-08-12

类型：发明专利

摘要

本发明涉及机器翻译技术领域，具体为基于多模态交互的翻译方法和系统，一方面，当存在文本模态时，根据是否存在文本模态的音频模态来分别执行不同的操作；其中，当存在音频模态时，将音频模态翻译为文本向量后与文本模态对应向量进行融合；当不存在音频模态时，将文本模态进行初步翻译后再与文本模态对应向量进行拼接，并进行时序语义分析；另一方面，当不存在文本模态时，将音频模态或/和图像模态翻译为文本向量；最后，将上述特征提取得到的音频文本融合特征向量、或文本时序特征向量、或第二音频仿文本向量、或图像仿文本向量、或融合仿文本向量通过机器翻译处理，得到更为准确的翻译结果，实现机器翻译的全面性、灵活性、适应性和准确性。

技术关键词

文本多模态交互翻译方法语音信号特征音频特征图像增强语音特征提取特征提取模块时序序列融合特征上下文特征声学特征语义机器翻译技术信息熵翻译设备

系统为您推荐了相关专利信息

基于大型语言模型的图像分割方法、装置、电子设备

图像分割方法射线文本视觉非暂态计算机可读存储介质

基于鱼眼视觉与SEEM-YOLO级联架构的动态库位状态监测方法

鱼眼相机生成感兴趣区域文本特征向量状态监测方法图像

一种基于多元知识分析的操作票人员资质标准制定方法

节点关系弱标注数据知识图谱构建词典

一种基于文本驱动和注意力机制的3D形状分割方法及系统

形状分割方法注意力机制拉普拉斯文本融合特征

一种组合零样本图像分类及模型的训练方法和装置

基元神经网络模型零样本图像分类训练集分支

基于多模态交互的翻译方法和系统

站点导航

APP 下载