摘要
本发明提供一种语音处理方法、装置、设备、介质及产品,该方法包括:获取目标语音和目标语音的翻译模式;基于语音处理模型中的语音编码器模块和翻译模式,对目标语音进行编码,得到目标语音的语音内容特征和声学特征;基于语音处理模型中的大语言模型、翻译模式和语音内容特征,对目标语音进行翻译,得到目标语音的目标翻译文本;基于语音处理模型中的语音解码器模块、翻译模式和声学特征,对目标翻译文本进行语音合成,得到目标语音的目标翻译语音。本发明实现通过集成语音翻译和语音同传的一体化框架的语音处理模型,结合翻译模式对语音编码、翻译和语音解码进行适配处理,以更好地降低部署成本、优化语音处理的实时性和质量。
技术关键词
声学特征
语音解码器
文本
模式
语义特征
语音编码器
大语言模型
融合特征
非暂态计算机可读存储介质
样本
模块
处理器
适配器
计算机程序产品
存储器
电子设备
系统为您推荐了相关专利信息
专业性内容智能化生成方法
语义
BERT模型
文本
主题
红外相机
成像方法
气体泄漏检测
气体浓度分布
损失函数设计