摘要
本申请属于音频处理技术领域,涉及一种音频识别方法、装置、计算机设备及存储介质,包括:获取声音采集设备采集到的采集声音信号;对所述采集声音信号进行预处理,得到预处理声音信号;对所述预处理声音信号进行短时特征提取处理,得到短时特征数据;根据GMM‑HMM联合模型对所述预处理声音信号进行联合特征提取处理,得到人声特征数据以及环境特征数据;将所述短时特征数据、人声特征数据以及环境特征数据输入至深度神经网络模型进行音频识别处理,得到音频识别结果并输出。本申请使用GMM‑HMM联合补偿模型,从语音信号中提取能够代表说话人和环境因素的特征,能够更全面地捕捉语音信号中的稳定随机因素,从而提高模型的鲁棒性和适应性。
技术关键词
音频识别方法
深度神经网络模型
短时特征
信号强度信息
子模块
啸叫噪声
联合特征提取
图像特征数据
音频识别装置
计数器
图像特征提取
计算机可读指令
声音采集设备
人声
相位特征
音频识别模块
多模态特征融合
系统为您推荐了相关专利信息
贝叶斯神经网络
概率预测方法
原油
油样
预测特征
工业机器人智能
节点
路径规划方法
子模块
激光雷达安装角度
深度神经网络
驱动方法
电力数据处理技术
子模块
机组