一种音频识别方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510178802

申请日期：2025-02-18

公开号：CN119673149B

公开日期：2025-10-21

类型：发明专利

摘要

本申请属于音频处理技术领域，涉及一种音频识别方法、装置、计算机设备及存储介质，包括：获取声音采集设备采集到的采集声音信号；对所述采集声音信号进行预处理，得到预处理声音信号；对所述预处理声音信号进行短时特征提取处理，得到短时特征数据；根据GMM‑HMM联合模型对所述预处理声音信号进行联合特征提取处理，得到人声特征数据以及环境特征数据；将所述短时特征数据、人声特征数据以及环境特征数据输入至深度神经网络模型进行音频识别处理，得到音频识别结果并输出。本申请使用GMM‑HMM联合补偿模型，从语音信号中提取能够代表说话人和环境因素的特征，能够更全面地捕捉语音信号中的稳定随机因素，从而提高模型的鲁棒性和适应性。

技术关键词

音频识别方法深度神经网络模型短时特征信号强度信息子模块啸叫噪声联合特征提取图像特征数据音频识别装置计数器图像特征提取计算机可读指令声音采集设备人声相位特征音频识别模块多模态特征融合

系统为您推荐了相关专利信息

一种混合原油凝点概率预测方法、装置、设备及介质

贝叶斯神经网络概率预测方法原油油样预测特征

一种工业机器人智能路径规划方法与系统

工业机器人智能节点路径规划方法子模块激光雷达安装角度

一种用于CIPN缓解的运动干预多维度决策支持系统及方法

决策支持系统仿真模型运动子模块仿真数据

一种用于带电指示器工频波形失真的校正系统及方法

带电指示器校正系统校正策略波形模型谐波

面向直流最优潮流求解的数据机理联合驱动方法及系统

深度神经网络驱动方法电力数据处理技术子模块机组

一种音频识别方法、装置、计算机设备及存储介质

站点导航

APP 下载