摘要
本申请实施例属于语音翻译技术领域,应用于实时语音同声传译场景中,涉及一种传译方法、装置、设备及其存储介质,包括向传译终端发送连接请求;在接收到连接成功反馈后,获取发言用户的实时语音;对实时语音进行特征解耦,提取出语言特征和声学特征;根据传译终端预期传译的目标语种信息对语言特征中待翻译文本进行翻译,得到预期文本;将所述语言特征、所述声学特征、所述预期文本发送到预设的语音合成模型,进行语音合成,并向目标用户实时播放语音合成结果。本申请结合了语音预训练解耦技术,能够更高效,实时流式的完成语音翻译及推理,且根据发言用户的声学特征进行语音合成,使得传译的语音为发言用户音色的语音。
技术关键词
实时语音
传译方法
声学特征
文本
计算机可读指令
解耦技术
预测模型训练
同声翻译
播放组件
传输终端
语音翻译技术
在线
序列
训练集
语音识别技术
模型预训练
同声传译
可读存储介质
系统为您推荐了相关专利信息
智能问答平台
AI开放平台
工作模块
数据存储模块
开放接口调用
配送路径优化方法
智能货物
调度员
路径优化算法
路径规划算法
标尺
图像像素
刻度
注意力机制
Kmeans算法