一种说话人语音识别方法

正文

推荐专利

一种说话人语音识别方法

申请号：CN202510480115

申请日期：2025-04-17

公开号：CN119993154B

公开日期：2025-07-08

类型：发明专利

摘要

本申请涉及一种说话人语音识别方法，涉及电话语音信号处理技术领域。所述方法包括：实时获取待识别通话音频，并将所述待识别通话音频切分为若干音频块；针对每个所述音频块，提取该音频块的语音特征，并输入至预先训练的说话人语音识别模型中；通过所述说话人语音识别模型输出该音频块属于目标说话人的归属概率；如果该音频块属于目标说话人的归属概率大于预设的说话人归属概率阈值，则判定所述音频块属于目标说话人。采用本申请可以实现复杂场景下的目标说话人识别。

技术关键词

音频块说话人语音识别语音活动检测语音特征语音识别方法特征加权融合编码器模块语音信号处理技术多任务损失函数引入注意力机制说话人识别输出模块声学特征人声发声电话

一种说话人语音识别方法

站点导航

APP 下载