摘要
本发明公开了一种基于低资源场景的人声检测语音识别方法,将声学模型分成网络浅层和网络深层;在所述网络浅层添加人声检测神经元;语音数据先用所述网络浅层的算力资源并由所述人声检测神经元判定含有人声;当语音数据的音素持续时间在预设持续时间范围内时;调用网络深层的算力资源对语音数据进行识别。使得语音数据在经过该神经网络时,可以在低算力资源的情况下对非平稳噪声进行有效识别,同时可以大幅度减少非指令人声的误识别。
技术关键词
人声
语音识别方法
语音识别系统
语音声学模型
语音识别模块
维特比解码
神经网络参数
资源
数据
可读存储介质
场景
表达式
序列
词典
文本
指令
系统为您推荐了相关专利信息
麦克风阵列信号
语音
计算机程序产品
深度神经网络模型
头戴设备
多阶段特征
语音识别方法
交互式特征
语音识别模型
融合特征
智能问答装置
智能问答方法
便携箱
政务
自然语言