基于深度学习的音频自动标签方法及系统

正文

推荐专利

基于深度学习的音频自动标签方法及系统

申请号：CN202510729416

申请日期：2025-06-03

公开号：CN120877768A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种基于深度学习的音频自动标签方法及系统，涉及音频信号处理及深度学习领域，基于深度学习的音频自动标签方法主要包括：对输入音频进行预处理得到三通道梅尔频谱图；利用人工智能开发工具构建多层卷积神经网络；对三通道梅尔频谱图进行数据增强处理得到增强数据；利用增强数据对多层卷积神经网络进行训练和优化得到预训练模型；基于测试时增强策略，利用预训练模型对输入音频图像进行预测得到音频标签集合。实施本发明提供的基于深度学习的音频自动标签方法及系统，能提高音频标签预测的实时性、准确性和鲁棒性。

技术关键词

多层卷积神经网络自动标签预训练模型三通道多标签数据滤波器音频信号处理指标非线性特征特征提取模块图像阶段策略动态采样率

系统为您推荐了相关专利信息

一种基于可学习图增强和增强型对比损失的网络节点自动分类与个性化匹配方法

样本矩阵定义网络节点 Sigmoid函数

基于改进多极化特征提取聚合网络的PEC信号接地网多参数检测方法

参数检测方法多层卷积神经网络接地网钢筋局部特征提取信号

基于多模态数据和适应性大模型的共病协同识别与风险预警方法及系统

风险预警方法多模态模态特征在线学习机制风险预警系统

性能测试用例优先级排序处理方法、装置、设备和介质

性能测试用例版本控制系统分块语义函数调用关系

一种基于监控图像的高速公路夜间能见度检测方法

能见度检测方法道路能见度检测道路图像数据离散余弦变换监控相机

基于深度学习的音频自动标签方法及系统

站点导航

APP 下载