摘要
本申请公开了一种语音翻译方法、装置、存储介质及设备,该方法包括:首先提取目标语音的声学特征向量,然后将目标语音分别输入识别解码器和翻译解码器,得到识别文本和翻译文本;并基于编辑距离算法,根据识别文本、翻译文本和声学特征向量,确定实体词特征向量;接着将实体词特征向量分别输入识别解码器和翻译解码器,得到第一后验概率和第二后验概率;进而利用第一后验概率和第二后验概率进行实体词特征的对齐后,可以确定出目标语音对应的最终翻译结果。可见,由于本申请在对目标语音进行翻译时,是通过对双解码器输出特征的对齐,增强了双解码器间的一致性和转录精度,从而提高了目标语音对应的翻译结果的准确性,也提升了用户的翻译体验。
技术关键词
后验概率
解码器
编辑距离算法
文本
语音翻译方法
语音翻译设备
语音翻译装置
样本
可读存储介质
终端设备
处理器
注意力机制
卷积模块
字典
输出特征
存储器
指令
索引
计算机