摘要
本发明提供一种实时性语音交互方法、系统、计算机设备和存储介质,包括获取语音输入设备输入的语音信号;对语音信号进行初步处理;通过语音识别模块转换处理信号;通过流式处理机制将文本信息分段,并传输至语言处理模块;通过语言处理模块根据文本段生成回复信息,并动态调整文本段的参数;将回复信息发送至语音转换模块;通过语音转换模块将回复信息实时转换为合成语音信号,并发送至扬声器播放。本发明通过在本地设备上部署语音识别模块、语言处理模块及语音转换模块,减少数据传输的延迟、提高响应速度,并设有包含语言模型的语音处理模块,能适应不同的交互场景。通过流式处理机制,迅速获得反馈,动态调整文本段以提升情感和语境的处理。
技术关键词
语音交互方法
生成回复信息
文本
语音识别模块
语音输入设备
信号
计算机存储介质
扬声器
计算机设备
语音交互系统
机制
动态
分段
处理器
存储器
信噪比
参数
发音
系统为您推荐了相关专利信息
行人重识别模型
重识别方法
多模态
图像编码器
离散小波变换
协同控制方法
设备协同控制系统
协同控制装置
评分机制
机器学习算法