摘要
本发明公开了一种用于视觉语言生成式异常分析的强化学习方法,包括:利用开源视觉语言模型构造训练数据与任务,涵盖基于图像的问题及规则生成、任务解释生成及拒绝采样;将强化学习算法引入模型训练,增强其在异常分析任务中的推理、解释及标注框生成能力;结合视觉异常判断、解释内容与目标框设计奖励函数;基于构造数据与奖励函数迭代训练模型,完成后部署至实际监控系统。本发明通过强化学习优化视觉语言模型的异常分析能力,利用奖励函数引导模型生成更准确的异常判断、解释与定位,有效提升监控系统的智能化水平;开源模型的数据构造方法降低了训练成本,拒绝采样机制提高了数据质量。
技术关键词
强化学习方法
视觉
强化学习算法
数据构造方法
图片
策略
答案
贪心算法
异常事件
画面
图像
格式
精度
坐标
参数
矩阵
场景
工地