摘要
本发明涉及声学动态提取技术领域,具体地说,涉及一种基于深度神经网络的声学特征动态提取方法。其包括以下步骤:S1、对音频数据进行预处理,将音频数据分帧;S2、将分帧后的音频信号进行傅里叶变换,使其从时域信号转换到频域信号并得到频谱图;S3、对频谱图进行预处理,将预处理后频谱图作为深度神经网络的输入;S4、在深度神经网络中使用一阶和二阶差分参数实现动态特征提取,再将一阶和二阶差分参数组合成特征向量输入深度神经网络;S5、将提取的特征序列通过序列标注的方法输出音频信号中的时间变化信息;深度神经网络不仅能够自动提取声学特征,还能捕捉这些特征在时间序列上的动态变化,有利于对声学场景的理解和分类准确。
技术关键词
深度神经网络
动态提取方法
声学特征
动态特征提取
音频
傅里叶变换算法
序列
二维快速傅里叶变换
信号随时间
声学场景
参数
数据可视化
频率
神经网络模型
训练集
数据分布
带标签
系统为您推荐了相关专利信息
手机
计算机电子设备
内存
可读存储介质
云计算技术
深度神经网络模型
管理方法
边缘网关设备
数据处理框架
计算机程序代码
双目深度估计
强化学习代理
深度图
双目相机
相机标定
敏感信息识别
音频
语义分析模型
敏感信息处理方法
文本