一种实时性语音交互方法、系统、计算机设备和存储介质

AITNT
正文
推荐专利
一种实时性语音交互方法、系统、计算机设备和存储介质
申请号:CN202510249092
申请日期:2025-03-04
公开号:CN119993150A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供一种实时性语音交互方法、系统、计算机设备和存储介质,包括获取语音输入设备输入的语音信号;对语音信号进行初步处理;通过语音识别模块转换处理信号;通过流式处理机制将文本信息分段,并传输至语言处理模块;通过语言处理模块根据文本段生成回复信息,并动态调整文本段的参数;将回复信息发送至语音转换模块;通过语音转换模块将回复信息实时转换为合成语音信号,并发送至扬声器播放。本发明通过在本地设备上部署语音识别模块、语言处理模块及语音转换模块,减少数据传输的延迟、提高响应速度,并设有包含语言模型的语音处理模块,能适应不同的交互场景。通过流式处理机制,迅速获得反馈,动态调整文本段以提升情感和语境的处理。
技术关键词
语音交互方法 生成回复信息 文本 语音识别模块 语音输入设备 信号 计算机存储介质 扬声器 计算机设备 语音交互系统 机制 动态 分段 处理器 存储器 信噪比 参数 发音
系统为您推荐了相关专利信息
1
基于大模型的网页链接导航处理方法、装置以及设备
网页主题信息 文本 元素 广告类别 样式
2
基于多模态提示增强的行人重识别方法及装置
行人重识别模型 重识别方法 多模态 图像编码器 离散小波变换
3
一种边缘计算的多设备协同控制方法、装置及系统
协同控制方法 设备协同控制系统 协同控制装置 评分机制 机器学习算法
4
用于视频生成的方法、装置、设备、存储介质和程序产品
文本 对象 机器学习模型 音频 标识
5
面向语音识别噪声场景下多模态情感分析方法及系统
情感分析方法 语音 样本 文本 噪声
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号