融合声学特征和深度学习特征的蛋鸡声音识别方法及系统

AITNT
正文
推荐专利
融合声学特征和深度学习特征的蛋鸡声音识别方法及系统
申请号:CN202510515901
申请日期:2025-04-23
公开号:CN120472912A
公开日期:2025-08-12
类型:发明专利
摘要
本发明提供一种融合声学特征和深度学习特征的蛋鸡声音识别方法及系统,包括:获取待识别的原始音频信号和声音识别模型;其中,声音识别模型包括特征提取网络、特征融合网络和分类识别网络;利用特征提取网络对原始音频信号进行特征提取,得到频谱图特征、梅尔频率倒谱系数特征和深层语音特征;特征融合网络利用协同注意力机制或多头注意力机制将频谱图特征、梅尔频率倒谱系数特征和深层语音特征进行特征融合,得到融合后的特征;将融合后的特征输入分类识别网络,得到声音识别结果。本发明能够充分利用各种特征的优势,从多个角度对声音信号进行描述和分析,从而更准确地识别蛋鸡的声纹,显著提高蛋鸡声纹识别的准确率。
技术关键词
梅尔频率倒谱系数 融合声学特征 声音识别方法 深度学习特征 语音特征 特征提取网络 特征融合网络 蛋鸡 协同注意力 音频 多头注意力机制 双向长短期记忆网络 深度学习模型 非暂态计算机可读存储介质 滤波器 声音识别系统 信号获取模块
系统为您推荐了相关专利信息
1
一种基于多模态模型的情绪动态分解与响应方法
序列 标签 语音识别模型 语音数字信号处理 令牌
2
基于互信息的强度可控的情感语音合成方法
语谱图 文本编码器 强度 语音特征 情感分类器
3
语音匿名化方法、装置、计算机设备及存储介质
匿名化方法 特征点 K近邻 计算机设备 匿名化装置
4
基于时空信息融合的自动驾驶场景三维目标检测方法及设备
检测网络模型 深度学习特征提取 匈牙利算法 场景 编码
5
一种多模态引导的高保真度图像压缩方法、系统及介质
图像压缩方法 多模态特征融合 音频编码器 音频特征 图像编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号