融合声学特征和深度学习特征的蛋鸡声音识别方法及系统

正文

推荐专利

申请号：CN202510515901

申请日期：2025-04-23

公开号：CN120472912A

公开日期：2025-08-12

类型：发明专利

摘要

本发明提供一种融合声学特征和深度学习特征的蛋鸡声音识别方法及系统，包括：获取待识别的原始音频信号和声音识别模型；其中，声音识别模型包括特征提取网络、特征融合网络和分类识别网络；利用特征提取网络对原始音频信号进行特征提取，得到频谱图特征、梅尔频率倒谱系数特征和深层语音特征；特征融合网络利用协同注意力机制或多头注意力机制将频谱图特征、梅尔频率倒谱系数特征和深层语音特征进行特征融合，得到融合后的特征；将融合后的特征输入分类识别网络，得到声音识别结果。本发明能够充分利用各种特征的优势，从多个角度对声音信号进行描述和分析，从而更准确地识别蛋鸡的声纹，显著提高蛋鸡声纹识别的准确率。

技术关键词

梅尔频率倒谱系数融合声学特征声音识别方法深度学习特征语音特征特征提取网络特征融合网络蛋鸡协同注意力音频多头注意力机制双向长短期记忆网络深度学习模型非暂态计算机可读存储介质滤波器声音识别系统信号获取模块

系统为您推荐了相关专利信息

一种基于多模态模型的情绪动态分解与响应方法

序列标签语音识别模型语音数字信号处理令牌

基于互信息的强度可控的情感语音合成方法

语谱图文本编码器强度语音特征情感分类器

语音匿名化方法、装置、计算机设备及存储介质

匿名化方法特征点 K近邻计算机设备匿名化装置

基于时空信息融合的自动驾驶场景三维目标检测方法及设备

检测网络模型深度学习特征提取匈牙利算法场景编码

一种多模态引导的高保真度图像压缩方法、系统及介质

图像压缩方法多模态特征融合音频编码器音频特征图像编码器

融合声学特征和深度学习特征的蛋鸡声音识别方法及系统

站点导航

APP 下载