摘要
本发明属于实时翻译技术领域,公开了一种基于深度学习的多语言翻译方法及系统,所述方法包括:采集语音信号,对语音信号进行特征提取与融合,得到语音特征;基于预训练的语音识别模型对语音特征进行识别,得到语音识别结果;基于语音识别结果生成待翻译的语言文本,对待翻译的语言文本进行特征提取,得到语言词嵌入表示;基于预先构建的样本词汇表示,对语言词嵌入表示进行扩展,得到扩展后的语言词嵌入表示;将扩展后的语言词嵌入表示输入至预训练的翻译模型中,所述翻译模型输出多语言翻译译文。本发明可以降低背景噪声的影响,提高语音识别的准确度,较高准确度的语音识别结果,有利于提高翻译的准确度;以及提高了小语种语言翻译的准确度。
技术关键词
语言翻译方法
翻译模型
语音特征
语音识别模型
MFCC算法
多语言
融合特征
文本
语言翻译系统
信号
样本
注意力机制
特征识别模块
翻译工具
翻译技术
词袋模型
扩展模块
编码器
元素
系统为您推荐了相关专利信息
表情动画生成方法
三维虚拟形象
网格模板
音频特征
序列
振动模型建立方法
发音
模型建立系统
局部二值模式
灰度共生矩阵
语音指令集
视觉装置
焊接工艺流程
焊接车间
语音交互方法
信息识别方法
语音特征
AR设备
语音识别模型
特征提取模型