摘要
本发明提供一种融合声学特征和深度学习特征的蛋鸡声音识别方法及系统,包括:获取待识别的原始音频信号和声音识别模型;其中,声音识别模型包括特征提取网络、特征融合网络和分类识别网络;利用特征提取网络对原始音频信号进行特征提取,得到频谱图特征、梅尔频率倒谱系数特征和深层语音特征;特征融合网络利用协同注意力机制或多头注意力机制将频谱图特征、梅尔频率倒谱系数特征和深层语音特征进行特征融合,得到融合后的特征;将融合后的特征输入分类识别网络,得到声音识别结果。本发明能够充分利用各种特征的优势,从多个角度对声音信号进行描述和分析,从而更准确地识别蛋鸡的声纹,显著提高蛋鸡声纹识别的准确率。
技术关键词
梅尔频率倒谱系数
融合声学特征
声音识别方法
深度学习特征
语音特征
特征提取网络
特征融合网络
蛋鸡
协同注意力
音频
多头注意力机制
双向长短期记忆网络
深度学习模型
非暂态计算机可读存储介质
滤波器
声音识别系统
信号获取模块
系统为您推荐了相关专利信息
匿名化方法
特征点
K近邻
计算机设备
匿名化装置
检测网络模型
深度学习特征提取
匈牙利算法
场景
编码
图像压缩方法
多模态特征融合
音频编码器
音频特征
图像编码器