一种基于深度学习的音频哈希生成方法

AITNT
正文
推荐专利
一种基于深度学习的音频哈希生成方法
申请号:CN202510216291
申请日期:2025-02-26
公开号:CN120296196A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于深度学习的音频哈希生成方法,包括:S1、对输入音频信号进行频谱分析并提取频率倒谱系数;S2、将上述步骤得到音频特征向量进行主成分分析降维;S3、通过空间注意力机制对频谱能量维度上各片段进行加权,以优化特征表达;S4、通过动态池化层将不同长度的音频特征与全连接层对齐;S5、根据降维后的特征向量,通过相邻元素大小关系生成最终音频哈希值。根据本发明,所述方法对音频的时间偏移、频率变化和增加噪声等常见干扰具有显著的鲁棒性,在保证高效存储的同时,确保了音频哈希的稳定性和准确性,适用于大规模音频数据库的检索与版权保护。
技术关键词
主成分分析降维 生成方法 短时傅里叶变换 注意力机制 音频特征 频率 谱图特征 三元组 神经网络模型 协方差矩阵 动态 信号 模块 元素 采样率 关系 鲁棒性
系统为您推荐了相关专利信息
1
一种高光谱图像的分类方法及系统
状态空间模型 变量 分类方法 分支 字典
2
一种基于深度学习的空中目标意图识别模型
意图识别模型 注意力机制 知识蒸馏方法 输出特征 协方差矩阵
3
一种基于图像识别与深度学习的数字烟雾生成方法及系统
吸烟者 生成方法 深度学习模型 显示终端 流量传感器
4
一种新能源电量需求预测模型构建方法、预测方法及装置
需求预测模型 时序 变量 数据 注意力机制
5
一种基于改进YOLOv5s的风电塔筒表面裂缝智能检测方法
风电塔筒 智能检测方法 图像 模块 椒盐噪声
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号