摘要
本发明涉及一种基于神经网络的音频特征提取方法及装置。该方法:对车载麦克风采集的原始音频信号进行分帧处理和快速傅里叶变换,得到频域特征序列;对频域特征序列提取短时能量、过零率、频谱质心以及梅尔频率倒谱系数,并结合各特征的一阶差分和二阶差分特征,得到多维声学特征点序列;对多维声学特征点序列进行时序排列,构建原始特征矩阵,并对原始特征矩阵进行主成分分析,得到特征描述矩阵;将特征描述矩阵输入动态时间特征提取网络进行深层时频特征分析,得到车载语音深层时频特征;基于车载语音深层时频特征进行语音检测分类,输出车载语音检测结果。本发明有效抑制了车载环境中的多种噪声干扰,增强了系统的抗噪声能力。
技术关键词
音频特征提取方法
序列
梅尔频率倒谱系数
频域特征
神经网络分类器
声学特征
特征提取网络
车载麦克风
语音特征
特征协方差矩阵
噪声特征
BIRCH聚类算法
Wiener滤波器
成分分析
融合特征
离散余弦变换
注意力
系统为您推荐了相关专利信息
动态预测模型
货箱
码头
多元回归模型
时间序列模型
网络状态信息
车载网络
智能选路方法
WLAN技术
滑动窗口技术
采样率
数据采集方法
数据采集系统
数字孪生技术
基准
时序预测模型
时序特征
多尺度
补丁
多元时间序列数据