摘要
本发明公开了一种基于大模型与专家引导的密集目标检测方法及装置。该方法通过借助图像大模型的检测能力对图像数据进行初步目标检测;对初步标注结果进行人工审核与补充,并将完整的标签数据作为强化学习模型的训练目标或奖励信号。随后,采用基于专家对强化学习的训练过程进行引导,优化模型训练策略,加速模型收敛速度,使模型获得密集小目标图像检测能力。所述图像大模型可以是目标检测模型或图像分割模型,对检测结果或分割结果转换为强化学习标签。强化学习决策模型可适用于DQN、PPO等通用强化学习算法。经过训练后的强化学习模型能够实现对新的图像数据的密集目标标注,提高模型在密集小目标中的检测能力。
技术关键词
强化学习方法
强化学习模型
数据
网络
策略
强化学习环境
损失函数设计
图像分割模型
强化学习算法
标签
决策
处理器
样本
视角
可读存储介质
存储器
参数
程序
方程
系统为您推荐了相关专利信息
物联网数据分析
溯源方法
节点
硫化氢气体传感器
反距离加权插值算法
格栅除污系统
监测传感器
输出端轴承
输入端轴承
状态监测数据
数据访问控制方法
细粒度权限
面向无人机
访问控制策略
无人机数据