一种基于深度神经网络的声学特征动态提取方法

正文

推荐专利

申请号：CN202411113422

申请日期：2024-08-14

公开号：CN119274543A

公开日期：2025-01-07

类型：发明专利

摘要

本发明涉及声学动态提取技术领域，具体地说，涉及一种基于深度神经网络的声学特征动态提取方法。其包括以下步骤：S1、对音频数据进行预处理，将音频数据分帧；S2、将分帧后的音频信号进行傅里叶变换，使其从时域信号转换到频域信号并得到频谱图；S3、对频谱图进行预处理，将预处理后频谱图作为深度神经网络的输入；S4、在深度神经网络中使用一阶和二阶差分参数实现动态特征提取，再将一阶和二阶差分参数组合成特征向量输入深度神经网络；S5、将提取的特征序列通过序列标注的方法输出音频信号中的时间变化信息；深度神经网络不仅能够自动提取声学特征，还能捕捉这些特征在时间序列上的动态变化，有利于对声学场景的理解和分类准确。

技术关键词

深度神经网络动态提取方法声学特征动态特征提取音频傅里叶变换算法序列二维快速傅里叶变换信号随时间声学场景参数数据可视化频率神经网络模型训练集数据分布带标签

系统为您推荐了相关专利信息

云手机的内容处理方法、装置、设备及存储介质

手机计算机电子设备内存可读存储介质云计算技术

基于生产流程数据的能碳管理方法、系统、介质、终端及程序产品

深度神经网络模型管理方法边缘网关设备数据处理框架计算机程序代码

一种用于双目深度估计的相机参数自动优化系统、方法、介质和设备

双目深度估计强化学习代理深度图双目相机相机标定

一种面向课堂教学引导的多模态语义对齐方法

语义对齐方法原型数据跨模态

音频的敏感信息处理方法及其装置、电子设备及存储介质

敏感信息识别音频语义分析模型敏感信息处理方法文本

一种基于深度神经网络的声学特征动态提取方法

站点导航

APP 下载