一种音频识别方法及装置

AITNT
正文
推荐专利
一种音频识别方法及装置
申请号:CN202510972010
申请日期:2025-07-14
公开号:CN120656482A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种音频识别方法及装置,属于音频识别技术领域,所述方法包括:对音频数据进行形式转换处理,得到所述音频数据对应的张量形式的张量特征数据;通过音频识别模型对所述张量特征数据进行特征转化处理和循环特征提取处理,得到所述张量特征数据对应的高维音频特征数据,并通过所述音频识别模型对所述高维音频特征数据进行分类处理,识别出所述音频数据中是否存在异常声音以及在存在所述异常声音的情况下输出所述异常声音所属的类别。本申请的音频识别模型通过轻量化设计,可以节省大量硬件资源,能够在计算资源和存储空间有限的边缘设备上部署和高效运行,实现快速准确的异常音频识别。
技术关键词
音频特征数据 异常声音 音频识别方法 多分支 声音类别 融合特征 多阶段 音频识别技术 音频识别装置 训练装置 样本 注意力 特征提取单元 模型训练模块 可读存储介质
系统为您推荐了相关专利信息
1
一种基于点云视频的语义特征优化与QoE评估方法
重建点云 视频 语义特征提取 多分支结构 矩阵
2
入侵检测网络模型的训练方法及装置、设备、存储介质
检测网络模型 频域特征 网络流量数据 多分支 融合特征
3
一种基于多支路卷积注意力模型的光学影像图像分割方法
卷积注意力网络 注意力模型 图像分割方法 支路 掩码矩阵
4
基于RepViT和十字卷积的SAR图像舰船检测方法
图像舰船检测方法 输出特征 上采样 切片 特征融合网络
5
基于改进的LSTM增强心电图(ECG)分类方法
心电信号识别分类 连续小波变换 多分支 生物医学信号处理 卷积神经网络模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号