摘要
本发明涉及一种基于动态阈值,分类定位分数融合的多类别密集目标计数与定位方法:获取点标注数据,对图像数据进行预处理;搭建一个视觉Transformer框架,在主干网络后嵌入一个阈值回归头,在Transformer解码器中嵌入一个定位分数回归头,完成网络构建,并对网络参数初始化;训练阶段,通过匹配预测点与标注点,获得实际定位分数,监督预测定位分数;融合分类分数与定位分数得到联合分数,搜索最优阈值,监督预测阈值;使用优化算法,训练整个模型;测试阶段,保留训练后模型参数,使用预测的动态阈值筛选联合分数得到预测结果,在数据集上进行测试。本发明通过引入动态阈值预测和分类定位分数融合,实现了精确的多类别密集群体计数与定位,在计数与定位上均达到了当前最佳效果。
技术关键词
预测阈值
定位方法
动态
密集群体计数
读取图像数据
网络
图像编码器
场景类别
解码器
视觉
坐标
参数
算法
阶段
框架
系统为您推荐了相关专利信息
量化评估方法
量化评估指标体系
模糊综合评价模型
内河船舶
动态可视化
食品安全监控方法
大数据
预警体系
食品安全监控系统
多阈值
大语言模型
多模态数据融合
机器人控制方法
场景
决策