基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备

AITNT
正文
推荐专利
基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备
申请号:CN202510993308
申请日期:2025-07-18
公开号:CN120727034A
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开的一种基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备,包括:收集畜禽的音频信号;将畜禽的音频信号输入到多模态音频特征提取模块中提取音频的时序模态特征和频谱模态特征;将提取的时序模态特征和频谱图模态特征输入到跨模态音频特征提取模块中进行特征融合,最后由分类器对畜禽的音频进行预测,完成畜禽异常声音识别。因此,本发明显著提升实际生产环境中畜禽咳嗽声识别准确率,具有更高的实际工程应用价值。
技术关键词
音频特征提取 模态特征 异常声音 多模态 识别方法 时序 分类器 线性 跨模态 声音识别单元 数据 样本 滑动窗口 模块 信号采集单元 编码器结构 特征提取单元 瓶颈结构
系统为您推荐了相关专利信息
1
一种基于大数据的文案语义识别系统及方法
语义识别系统 识别模型训练 大数据 真实性验证 语义信息提取
2
一种基于脊椎侧弯影像筛查装置的操作系统
筛查装置 权限管理系统 操作系统 脊椎 操作界面
3
一种避雷器瓷套破裂故障识别方法、系统、设备及存储介质
避雷器瓷套 分类器模型 故障识别方法 计算机可执行指令 参数
4
一种融合注意力与MarkBERT的防震减灾实体识别方法及系统
防震减灾 实体识别方法 动态上下文 文本 深度学习模型
5
一种基于监督式非对称对比的车辆重识别方法及装置
车辆重识别模型 训练样本集 重识别方法 图像库 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号