识别人声持续语音段的方法、系统、介质、程序产品

AITNT
正文
推荐专利
识别人声持续语音段的方法、系统、介质、程序产品
申请号:CN202510803825
申请日期:2025-06-17
公开号:CN120356475B
公开日期:2025-10-03
类型:发明专利
摘要
提供识别人声的持续语音段的方法、识别人声的持续语音段的设备、非暂时存储介质、计算机程序产品。该方法包括通过变分模态分解和伽玛通频率倒谱系数滤波器从时间上连续的多个待识别音频帧中提取关于人声的仿真人耳基底膜感应信息的多个待识别特征;用提取的多个待识别特征输入语音类别分类神经网络,以便从多个待识别音频帧中确定多个待识别音频帧中具有人声的多个后验概率;根据所述多个待识别音频帧中确定的多个具有人声的后验概率,识别出人声的一个或多个持续语音段。如此,能够提升复杂噪声背景情况下儿童人声的持续语音段的检测能力,确保例如教育场景下语音识别、语音评测系统的识别性能和评测性能的稳定。
技术关键词
分类神经网络 人声 语音类别 音频 识别特征 过渡段 滤波器 样本 后验概率 计算机程序产品 关系 识别装置 频率 教育场景 处理器 评测系统 数据 指令 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号