语音对话的流式处理方法及其装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510732163

申请日期：2025-06-03

公开号：CN120580989A

公开日期：2025-09-02

类型：发明专利

摘要

本发明公开了一种语音对话的流式处理方法及其装置、电子设备及存储介质，涉及音视频技术领域或其他相关技术领域，其中，语音对话的流式处理方法包括：接收连续的语音流，并获取语音流对应的历史对话文本；将语音流和历史对话文本输入至流式处理模型，输出流式语音融合特征向量，其中，流式处理模型基于状态空间模型和动态选择机制对语音流进行特征提取；将流式语音融合特征向量输入至语言处理模型，输出响应文本；基于响应文本生成响应音频，并向用户端返回响应音频。本发明解决了相关技术中，级联架构下的语音对话处理效率较低的技术问题。

技术关键词

状态空间模型语音特征文本特征向量序列实时语音动态可读存储介质音频音视频技术电子设备依赖特征计算机矩阵时序特征注意力机制分段处理器

语音对话的流式处理方法及其装置、电子设备及存储介质

站点导航

APP 下载