摘要
本发明公开了一种基于预训练神经网络的任意采样率声音分析方法,涉及声音分析技术领域。包括以下步骤,获取输入音频,转化语谱图,将输入音频进行短时傅里叶变换得到语谱图。本发明解决对采样率跨度差异较大的各种声音信号(如8KHz‑192KHz)统一建模困难的问题。不同于传统的基于重采样的方法,本发明提出在时频域的语谱图上进行固定频段的子带切分,对子带进行建模,可以将任意采样率的语谱图分解为子带图的组合,对子带图提取高维表征后进行向量拼接,得到最终信号表征。在高维表征层面进行向量距离计算判断声音片段之间的相似度。该方法不仅适用于声音,对高频振动等数字信号同样适用。
技术关键词
声音分析方法
训练神经网络
语谱图
短时傅里叶变换
采样率
神经网络训练
声音分析技术
音频
预训练模型
语音
信号
频率
异音
元素
工业
纵轴
跨度
横轴
频段
重构
系统为您推荐了相关专利信息
短时傅里叶变换
数据标注方法
深度学习模型
信号采集设备
电磁频谱监测技术
可见光图像
故障诊断方法
罩极电机
短时傅里叶变换
频谱特征
耳部
识别定位方法
穴位探测笔
融合特征
信号特征
叶片状态监测装置
多模态传感器
微型风力发电机
分布式光纤温度传感器
光纤光栅传感器阵列