流式语音交互方法及相关装置、设备和存储介质

正文

推荐专利

申请号：CN202510026410

申请日期：2025-01-08

公开号：CN119479620B

公开日期：2025-05-30

类型：发明专利

摘要

本申请公开了一种流式语音交互方法及相关装置、设备和存储介质，其中，流式语音交互方法包括：对流式语音进行端点检测，并响应于检测到流式语音的起始端点，对流式语音执行滑窗操作，得到语音帧，基于语音帧进行特征提取，得到语音帧的语音特征；输入语音帧的语音特征至用于识别流式语音的语音识别系统，得到语音帧的识别结果，基于语音帧的编码特征进行分类预测，得到语音帧的分类结果；响应于分类结果表征语义结束，基于从起始端点至结束端点各个语音帧的识别结果，得到识别文本，至少基于识别文本由智能对话模型进行处理，生成得到回复文本；响应于分类结果表征语义未结束，继续返回执行滑窗操作。上述方案，能够提升流式语音交互的适时性。

技术关键词

智能对话模型文本语音交互方法端点语音特征语音识别系统编码特征语义语音交互方式语音交互装置指令意图识别程序处理器可读存储介质模块存储器

系统为您推荐了相关专利信息

一种机械故障诊断方法、装置、设备及存储介质

机械故障诊断方法故障诊断信息旋转设备信号编码器大语言模型

图生视频模型生成方法、视频生成方法及装置

适配器样本注意力空间模块模型生成方法

一种基于Web的数据挖掘方法及系统

多模态数据融合数据挖掘系统模态特征数据挖掘方法跨模态

面向大语言模型的知识库构建方法、检索方法及相关装置

知识库构建方法大语言模型文本知识库检索方法列表

智能微型档案室的档案管理系统、方法及设备

档案管理系统协同过滤算法档案室编码局部敏感哈希索引

流式语音交互方法及相关装置、设备和存储介质

站点导航

APP 下载