摘要
本发明提供一种基于超高清视频的鸟群识别方法及系统,涉及鸟类识别技术领域,包括同步获取目标区域的视频流和音频流,并基于音频流中提取的频谱特征动态调整视频流的采集参数;对动态调整后的视频流进行时空特征提取,输出鸟类目标的空间坐标和视觉置信度;对音频流进行时频特征提取和声源定位,输出声源方位角和声学置信度;基于空间坐标和声源方位角进行空间一致性匹配,当两者空间距离小于预设阈值时判定为有效候选区域;对有效候选区域的视觉置信度和声学置信度进行加权计算,当加权计算得到的融合置信度超过判定阈值时,输出目标区域存在鸟类的识别结果,本发明通过多模态信息的有效融合和动态调整策略,提高鸟群识别的准确性和鲁棒性。
技术关键词
视频流
融合置信度
识别方法
方位角
二维平面坐标系
音频
视觉
频谱特征
动态权重分配
映射关系表
鸟类识别技术
高频段
鸟群识别
短时傅里叶变换
融合特征
多模态信息
参数
系统为您推荐了相关专利信息
图像智能识别方法
售货机商品
误差修正模型
识别误差
商品摆放位置
协同导航方法
捷联式惯性导航系统
方位角
观测噪声方差
数学模型
视觉传感器
托辊
语义分割算法
总面积比值
硬件系统