摘要
本发明涉及一种语音交互智能处理方法及实时通信设备,所述方法用于云端大模型、实时通信设备以及用户之间的通信,所述实时通信设备用于接收来自用户的用户指令语音,所述方法用于用户指令语音与设备播放声音同时存在的双讲场景,所述方法包括:采集混合音频信号,提取混合音频信号当中的有效语音信号;将有效语音信号转化为消回声语音信号,之后上传至云端大模型,处理后生成反馈语音流;接收从云端大模型传递的反馈语音流,并由本地渲染模块播放。现有语音交互系统在实时通信设备中的实际部署,存在技术问题;基于此,本申请所述方案,能够显著降低语音交互的延迟。
技术关键词
实时通信
动态码率
信号
云端
回声消除算法
RTP数据包
WebSocket协议
频谱特征
意图指令
音频
麦克风阵列采集
语音交互系统
序列
相位对齐
基线
路径匹配