一种音频识别方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
一种音频识别方法、装置、计算机设备及存储介质
申请号:CN202510178802
申请日期:2025-02-18
公开号:CN119673149B
公开日期:2025-10-21
类型:发明专利
摘要
本申请属于音频处理技术领域,涉及一种音频识别方法、装置、计算机设备及存储介质,包括:获取声音采集设备采集到的采集声音信号;对所述采集声音信号进行预处理,得到预处理声音信号;对所述预处理声音信号进行短时特征提取处理,得到短时特征数据;根据GMM‑HMM联合模型对所述预处理声音信号进行联合特征提取处理,得到人声特征数据以及环境特征数据;将所述短时特征数据、人声特征数据以及环境特征数据输入至深度神经网络模型进行音频识别处理,得到音频识别结果并输出。本申请使用GMM‑HMM联合补偿模型,从语音信号中提取能够代表说话人和环境因素的特征,能够更全面地捕捉语音信号中的稳定随机因素,从而提高模型的鲁棒性和适应性。
技术关键词
音频识别方法 深度神经网络模型 短时特征 信号强度信息 子模块 啸叫噪声 联合特征提取 图像特征数据 音频识别装置 计数器 图像特征提取 计算机可读指令 声音采集设备 人声 相位特征 音频识别模块 多模态特征融合
系统为您推荐了相关专利信息
1
一种混合原油凝点概率预测方法、装置、设备及介质
贝叶斯神经网络 概率预测方法 原油 油样 预测特征
2
一种工业机器人智能路径规划方法与系统
工业机器人智能 节点 路径规划方法 子模块 激光雷达安装角度
3
一种用于CIPN缓解的运动干预多维度决策支持系统及方法
决策支持系统 仿真模型 运动 子模块 仿真数据
4
一种用于带电指示器工频波形失真的校正系统及方法
带电指示器 校正系统 校正策略 波形模型 谐波
5
面向直流最优潮流求解的数据机理联合驱动方法及系统
深度神经网络 驱动方法 电力数据处理技术 子模块 机组
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号