一种基于预训练神经网络的任意采样率声音分析方法

正文

推荐专利

申请号：CN202510126540

申请日期：2025-01-27

公开号：CN119905110B

公开日期：2025-12-16

类型：发明专利

摘要

本发明公开了一种基于预训练神经网络的任意采样率声音分析方法，涉及声音分析技术领域。包括以下步骤，获取输入音频，转化语谱图，将输入音频进行短时傅里叶变换得到语谱图。本发明解决对采样率跨度差异较大的各种声音信号（如8KHz‑192KHz）统一建模困难的问题。不同于传统的基于重采样的方法，本发明提出在时频域的语谱图上进行固定频段的子带切分，对子带进行建模，可以将任意采样率的语谱图分解为子带图的组合，对子带图提取高维表征后进行向量拼接，得到最终信号表征。在高维表征层面进行向量距离计算判断声音片段之间的相似度。该方法不仅适用于声音，对高频振动等数字信号同样适用。

技术关键词

声音分析方法训练神经网络语谱图短时傅里叶变换采样率神经网络训练声音分析技术音频预训练模型语音信号频率异音元素工业纵轴跨度横轴频段重构

系统为您推荐了相关专利信息

一种面向机器学习的电磁频谱数据标注方法

短时傅里叶变换数据标注方法深度学习模型信号采集设备电磁频谱监测技术

一种绿色节能罩极电机的故障诊断方法及系统

可见光图像故障诊断方法罩极电机短时傅里叶变换频谱特征

一种耳部穴位识别定位方法

耳部识别定位方法穴位探测笔融合特征信号特征

麦克风差分阵列的波束成形增强方法、设备及存储介质

阵列麦克风波束成形信噪比噪声功率谱信号

一种用于风力发电机的叶片状态监测装置及风力发电机

叶片状态监测装置多模态传感器微型风力发电机分布式光纤温度传感器光纤光栅传感器阵列

一种基于预训练神经网络的任意采样率声音分析方法

站点导航

APP 下载