摘要
本发明提供一种语音交互方法、装置、电子设备和存储介质,方法包括:获取用户语音流;对所述用户语音流进行语种识别,得到所述用户语音流对应的语种信息,并对所述用户语音流进行语音识别,得到与所述语种信息对应的识别文本;基于所述识别文本,得到与所述语种信息对应的交互合成语音,并播报所述交互合成语音。本发明提供的语音交互方法、装置、电子设备和存储介质,语音交互过程中无需用户手动切换或设置语种,用户可以随意输入系统支持的各类语种,实现多语种免切,从而提高了语音交互的便利性。此外,通过得到与语种信息对应的交互合成语音,能够实现语音交互全链路按照同一个语种进行交互,提高了用户体验感。
技术关键词
语音交互方法
语种识别
文本
语音特征
非暂态计算机可读存储介质
回声消除算法
语音交互装置
电子设备
自然语言理解
语音识别单元
解码器
全双工通信
输入系统
处理器
样本
编码器
存储器
端点
系统为您推荐了相关专利信息
神经网络混合模型
文本
神经网络模型构建
编码器
中文分词
序列
音频生成方法
文本编码器
音乐
人工智能模型