摘要
本发明提供一种有效语音检测方法及装置,所述方法包括:基于特征提取模型,提取待检测音频信号的音频特征;基于第一有效语音识别模型,应用音频特征,确定音频信号中的有效语音信号;特征提取模型和第一有效语音识别模型构成第一检测模型,第一检测模型在训练阶段与语音理解模型联合训练,语音理解模型以特征提取模型提取的音频特征作为输入,用于预测语音内容,联合训练的总损失值包括第一检测模型的有效语音检测损失值以及语音理解模型的语音理解损失值。本发明通过语音理解任务辅助训练第一检测模型,可以避免第一检测模型漏检有效语音,也即提升第一检测模型检测有效语音能力。
技术关键词
语音检测方法
音频特征
语音识别模型
特征提取模型
语音标签
信号
检测损失
样本
文本
非暂态计算机可读存储介质
语音检测装置
处理器
采样点
计算机程序产品
阶段
参数
网络
系统为您推荐了相关专利信息
三维人脸模型
表情特征提取
三维人脸重建
音频特征提取
顶点
内容审核方法
声学特征
词嵌入向量
人脸识别模型
特征提取模型
异常数据检测方法
功能性磁共振成像
多层感知机
样本
计算机程序产品