一种基于深度学习的音频哈希生成方法

正文

推荐专利

一种基于深度学习的音频哈希生成方法

申请号：CN202510216291

申请日期：2025-02-26

公开号：CN120296196A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种基于深度学习的音频哈希生成方法，包括：S1、对输入音频信号进行频谱分析并提取频率倒谱系数；S2、将上述步骤得到音频特征向量进行主成分分析降维；S3、通过空间注意力机制对频谱能量维度上各片段进行加权，以优化特征表达；S4、通过动态池化层将不同长度的音频特征与全连接层对齐；S5、根据降维后的特征向量，通过相邻元素大小关系生成最终音频哈希值。根据本发明，所述方法对音频的时间偏移、频率变化和增加噪声等常见干扰具有显著的鲁棒性，在保证高效存储的同时，确保了音频哈希的稳定性和准确性，适用于大规模音频数据库的检索与版权保护。

技术关键词

主成分分析降维生成方法短时傅里叶变换注意力机制音频特征频率谱图特征三元组神经网络模型协方差矩阵动态信号模块元素采样率关系鲁棒性

系统为您推荐了相关专利信息

一种高光谱图像的分类方法及系统

状态空间模型变量分类方法分支字典

一种基于深度学习的空中目标意图识别模型

意图识别模型注意力机制知识蒸馏方法输出特征协方差矩阵

一种基于图像识别与深度学习的数字烟雾生成方法及系统

吸烟者生成方法深度学习模型显示终端流量传感器

一种新能源电量需求预测模型构建方法、预测方法及装置

需求预测模型时序变量数据注意力机制

一种基于改进YOLOv5s的风电塔筒表面裂缝智能检测方法

风电塔筒智能检测方法图像模块椒盐噪声

一种基于深度学习的音频哈希生成方法

站点导航

APP 下载