基于深度学习的音频自动标签方法及系统

AITNT
正文
推荐专利
基于深度学习的音频自动标签方法及系统
申请号:CN202510729416
申请日期:2025-06-03
公开号:CN120877768A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于深度学习的音频自动标签方法及系统,涉及音频信号处理及深度学习领域,基于深度学习的音频自动标签方法主要包括:对输入音频进行预处理得到三通道梅尔频谱图;利用人工智能开发工具构建多层卷积神经网络;对三通道梅尔频谱图进行数据增强处理得到增强数据;利用增强数据对多层卷积神经网络进行训练和优化得到预训练模型;基于测试时增强策略,利用预训练模型对输入音频图像进行预测得到音频标签集合。实施本发明提供的基于深度学习的音频自动标签方法及系统,能提高音频标签预测的实时性、准确性和鲁棒性。
技术关键词
多层卷积神经网络 自动标签 预训练模型 三通道 多标签 数据 滤波器 音频信号处理 指标 非线性特征 特征提取模块 图像 阶段 策略 动态 采样率
系统为您推荐了相关专利信息
1
一种基于可学习图增强和增强型对比损失的网络节点自动分类与个性化匹配方法
样本 矩阵 定义 网络节点 Sigmoid函数
2
基于改进多极化特征提取聚合网络的PEC信号接地网多参数检测方法
参数检测方法 多层卷积神经网络 接地网钢筋 局部特征提取 信号
3
基于多模态数据和适应性大模型的共病协同识别与风险预警方法及系统
风险预警方法 多模态 模态特征 在线学习机制 风险预警系统
4
性能测试用例优先级排序处理方法、装置、设备和介质
性能测试用例 版本控制系统 分块 语义 函数调用关系
5
一种基于监控图像的高速公路夜间能见度检测方法
能见度检测方法 道路能见度检测 道路图像数据 离散余弦变换 监控相机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号