摘要
本发明公开的一种基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备,包括:收集畜禽的音频信号;将畜禽的音频信号输入到多模态音频特征提取模块中提取音频的时序模态特征和频谱模态特征;将提取的时序模态特征和频谱图模态特征输入到跨模态音频特征提取模块中进行特征融合,最后由分类器对畜禽的音频进行预测,完成畜禽异常声音识别。因此,本发明显著提升实际生产环境中畜禽咳嗽声识别准确率,具有更高的实际工程应用价值。
技术关键词
音频特征提取
模态特征
异常声音
多模态
识别方法
时序
分类器
线性
跨模态
声音识别单元
数据
样本
滑动窗口
模块
信号采集单元
编码器结构
特征提取单元
瓶颈结构
系统为您推荐了相关专利信息
语义识别系统
识别模型训练
大数据
真实性验证
语义信息提取
避雷器瓷套
分类器模型
故障识别方法
计算机可执行指令
参数
防震减灾
实体识别方法
动态上下文
文本
深度学习模型
车辆重识别模型
训练样本集
重识别方法
图像库
注意力机制