摘要
本申请涉及语音交互技术领域,尤其涉及一种基于FreeSWITCH可灵活打断播报的语音呼叫方法、系统及存储介质,方法包括基于FreeSWITCH开发模块mod_ai,FreeSWITCH通过模块mod_ai通信连接到DUI平台;模块mod_ai从FreeSWITCH读取用户的实时音频流并发送至DUI平台进行语音识别;DUI平台调用ASR引擎进行语音识别并生成应答文本;DUI平台调用TTS引擎将应答文本转换为音频流并返回给模块mod_ai;模块mod_ai将音频流写入FreeSWITCH并发送给用户;在数据交互过程中,模块mod_ai解析从DUI平台接收到的控制命令,根据控制命令调整音频播放的状态。本申请解决了传统语音交互方式的半双工限制,提升了用户体验,支持灵活、实时、双向的语音对话交互。
技术关键词
语音呼叫方法
命令
平台
TTS引擎
WebSocket协议
文本
语音呼叫系统
双向通信模块
语音交互方式
音频控制模块
语音交互技术
语音识别引擎
数据读取模块
语音识别模块
接口
程序
系统为您推荐了相关专利信息
大语言模型
客服管理平台
数据
自然语言文本
问答知识库
汽车耐久性测试
永磁同步伺服电机
扩张状态观测器
滚珠丝杠
位置更新
耦合机构
连续体
BP神经网络模型
训练集
过渡平台