基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备

正文

推荐专利

申请号：CN202510993308

申请日期：2025-07-18

公开号：CN120727034A

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开的一种基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备，包括：收集畜禽的音频信号；将畜禽的音频信号输入到多模态音频特征提取模块中提取音频的时序模态特征和频谱模态特征；将提取的时序模态特征和频谱图模态特征输入到跨模态音频特征提取模块中进行特征融合，最后由分类器对畜禽的音频进行预测，完成畜禽异常声音识别。因此，本发明显著提升实际生产环境中畜禽咳嗽声识别准确率，具有更高的实际工程应用价值。

技术关键词

音频特征提取模态特征异常声音多模态识别方法时序分类器线性跨模态声音识别单元数据样本滑动窗口模块信号采集单元编码器结构特征提取单元瓶颈结构

系统为您推荐了相关专利信息

一种基于大数据的文案语义识别系统及方法

语义识别系统识别模型训练大数据真实性验证语义信息提取

一种基于脊椎侧弯影像筛查装置的操作系统

筛查装置权限管理系统操作系统脊椎操作界面

一种避雷器瓷套破裂故障识别方法、系统、设备及存储介质

避雷器瓷套分类器模型故障识别方法计算机可执行指令参数

一种融合注意力与MarkBERT的防震减灾实体识别方法及系统

防震减灾实体识别方法动态上下文文本深度学习模型

一种基于监督式非对称对比的车辆重识别方法及装置

车辆重识别模型训练样本集重识别方法图像库注意力机制

基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备

站点导航

APP 下载