摘要
本发明适用于数字医疗技术领域,尤其涉及一种基于人工智能的语音翻译方法、装置、计算机设备及介质。本发明使用声学编码器对目标语音进行特征编码,得到声学特征序列,使用边界预测器对声学特征序列进行边界预测,得到每个特征值预测为边界的概率值并作为对应特征值的权重,对所有的特征值进行加权求和得到声学收缩特征,使用语义编码器提取声学收缩特征中的语义特征,使用解码器解码语义特征,得到在预设的目标语言下的目标翻译文本,通过对声学特征进行收缩,消除了语音特征和文本特征之间的长度差距问题,在进行语音翻译时有效地继承了预先训练的模型知识,提高了目标翻译文本的准确性,在数字医疗技术领域提高了医生的工作效率和工作质量。
技术关键词
特征值
声学特征
语音翻译方法
样本
解码器
语义特征
编码器
文本
序列
语音翻译装置
数字医疗技术
计算机设备
编码模块
可读存储介质
分类器
处理器