摘要
本发明涉及鸟类声纹处理技术领域,具体为一种鸟类声纹目标检测方法及系统。所述方法的步骤包括:使用短时傅里叶变换将音频信号转换为时频域表示,得到时频图,并对所述时频图进行尺度增广和频谱增强,以增强声纹特征的多样性。本发明通过引入多尺度频谱特征增广、声纹时频定位、半监督预训练和弱监督预训练等技术,提升了鸟类声纹目标检测的精度。本发明不仅能够有效应对复杂多变的自然环境,还能在保持高精度的同时,显著提升模型的泛化能力,为生物多样性保护等应用提供了可靠的鸟类声纹检测解决方案。
技术关键词
短时傅里叶变换
注意力机制
样本
加权损失函数
表达式
标签
定位技术
预训练模型
生物多样性保护
声纹特征
频谱特征
模拟真实环境
音频
离散小波变换
数据
半监督学习
超参数
置信度阈值
多尺度特征
系统为您推荐了相关专利信息
负荷预测方法
网络架构
解码器模型
注意力机制
传播算法
模态特征
双向注意力
障碍检测系统
多头注意力机制
跨模态