摘要
本发明公开了一种动物音频声纹识别的智能深度学习方法及系统,涉及了音频识别技术领域,采集目标区域内多个监测节点的动物音频,将动物音频处理为标准化音频信息包,滤除非目标声源,提取目标声源,对目标声源进行多模态特征提取,得到多模态声纹特征后进行置信度评估,获取满足置信筛选阈值的多模态声纹特征作为建模数据集,构建混合深度学习模型,输入建模数据集后声纹建模,生成声纹特征库以及目标声纹模板,将需要识别的动物音频声纹录入至声纹特征库,计算声纹相似度,标记出符合目标声纹模板的目标声纹片段,判断其是否存在模糊片段区域,根据判断结果决定是否进行上下文语义补全,输出最终完整声纹信息的识别结果。
技术关键词
声纹特征
智能深度学习
混合深度学习模型
动物
模板
采集终端
时域特征提取
频域特征提取
录音设备
语义特征提取
多模态
独立成分分析算法
指标
节点处
置信度阈值
音频识别技术
系统为您推荐了相关专利信息
深度学习模型
识别方法
深度学习网络
思路
深度学习技术
RFM模型
转化方法
语义分析模型
强度
计算机存储介质
图像畸变校正系统
图像生成设备
抬头显示设备
畸变缺陷
图像畸变校正方法
检测识别方法
轮廓提取
多视角
识别产品信息
检测识别系统
小鼠模型
基因型鉴定方法
PCR鉴定方法
房颤药物
基因敲除小鼠