一种基于双模型动态触发的语音流切分方法

正文

推荐专利

一种基于双模型动态触发的语音流切分方法

申请号：CN202510726884

申请日期：2025-06-03

公开号：CN120260546B

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于双模型动态触发的语音流切分方法，包括如下步骤：步骤1：构建多路语音流的数据流缓冲管理机制，为每个语音流建立独立处理通道，将积累到阈值时长的语音数据组成待处理语音集合；步骤2：通过快速切分模型筛选分析并处理待处理语音集合，选出符合条件的语音片段输出到高精度切分模型；步骤3：根据快速切分模型的筛选结果，将不符合条件数据与数据流缓冲中的数据进行拼接，调整语音片段对应缓冲区的阈值时长；步骤4：使用高精度切分模型处理经过快速切分模型筛选的语音片段；步骤5：根据处理结果将切分后的音频片段输出到语音识别等其他系统中，将剩余数据与数据流缓冲中的数据进行拼接，并更新对应缓冲区的阈值时长。

技术关键词

音频频谱特征数据滤波器语音识别系统缓冲结构滑动窗口梅尔频率倒谱系数一维卷积神经网络动态缓冲区结构二分类模型网络结构离散余弦变换采样点列表序列三角形

一种基于双模型动态触发的语音流切分方法

站点导航

APP 下载