识别人声持续语音段的方法、系统、介质、程序产品

正文

推荐专利

申请号：CN202510803825

申请日期：2025-06-17

公开号：CN120356475B

公开日期：2025-10-03

类型：发明专利

摘要

提供识别人声的持续语音段的方法、识别人声的持续语音段的设备、非暂时存储介质、计算机程序产品。该方法包括通过变分模态分解和伽玛通频率倒谱系数滤波器从时间上连续的多个待识别音频帧中提取关于人声的仿真人耳基底膜感应信息的多个待识别特征；用提取的多个待识别特征输入语音类别分类神经网络，以便从多个待识别音频帧中确定多个待识别音频帧中具有人声的多个后验概率；根据所述多个待识别音频帧中确定的多个具有人声的后验概率，识别出人声的一个或多个持续语音段。如此，能够提升复杂噪声背景情况下儿童人声的持续语音段的检测能力，确保例如教育场景下语音识别、语音评测系统的识别性能和评测性能的稳定。

技术关键词

分类神经网络人声语音类别音频识别特征过渡段滤波器样本后验概率计算机程序产品关系识别装置频率教育场景处理器评测系统数据指令标签

识别人声持续语音段的方法、系统、介质、程序产品

站点导航

APP 下载