一种实时性语音交互方法、系统、计算机设备和存储介质

正文

推荐专利

申请号：CN202510249092

申请日期：2025-03-04

公开号：CN119993150A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供一种实时性语音交互方法、系统、计算机设备和存储介质，包括获取语音输入设备输入的语音信号；对语音信号进行初步处理；通过语音识别模块转换处理信号；通过流式处理机制将文本信息分段，并传输至语言处理模块；通过语言处理模块根据文本段生成回复信息，并动态调整文本段的参数；将回复信息发送至语音转换模块；通过语音转换模块将回复信息实时转换为合成语音信号，并发送至扬声器播放。本发明通过在本地设备上部署语音识别模块、语言处理模块及语音转换模块，减少数据传输的延迟、提高响应速度，并设有包含语言模型的语音处理模块，能适应不同的交互场景。通过流式处理机制，迅速获得反馈，动态调整文本段以提升情感和语境的处理。

技术关键词

语音交互方法生成回复信息文本语音识别模块语音输入设备信号计算机存储介质扬声器计算机设备语音交互系统机制动态分段处理器存储器信噪比参数发音

系统为您推荐了相关专利信息

基于大模型的网页链接导航处理方法、装置以及设备

网页主题信息文本元素广告类别样式

基于多模态提示增强的行人重识别方法及装置

行人重识别模型重识别方法多模态图像编码器离散小波变换

一种边缘计算的多设备协同控制方法、装置及系统

协同控制方法设备协同控制系统协同控制装置评分机制机器学习算法

用于视频生成的方法、装置、设备、存储介质和程序产品

文本对象机器学习模型音频标识

面向语音识别噪声场景下多模态情感分析方法及系统

情感分析方法语音样本文本噪声

一种实时性语音交互方法、系统、计算机设备和存储介质

站点导航

APP 下载