摘要
本发明提供一种图像二分类模型的训练方法,包括:获取包括多对图像样本和图像标签的样本集;获取由对图像二分类模型进行初步训练得到的基础图像二分类模型,并复制得到参考模型;分别使用基础图像分类模型和参考模型针对每一个像素点进行分类,得到预测概率和参考概率;比较图像标签和预测概率,得到奖励和预测正确概率;根据奖励和预测正确概率,使用改进优势函数计算得到优势,且使用改进损失函数计算得到损失值,并根据损失值更新基础图像分类模型的参数;循环训练得到目标图像分类模型。通过充分利用图像二分类任务只有两种结果的特点,对GRPO强化学习算法进行改进,省略了用于采样的旧模型和采样步骤,有效节省了算力资源。
技术关键词
二分类模型
图像分类模型
二分类方法
样本
像素点
基础
标签
变化检测模型
强化学习算法
电子设备
图像获取模块
可读存储介质
处理器
分类装置
模型更新
训练装置
存储器
系统为您推荐了相关专利信息
输电塔线体系
可靠性方法
风速
输电线覆冰厚度
风荷载
表面参数检测方法
图像
膨胀算法
人工标记
消除噪声
载荷计算方法
分支
飞行器
拉丁超立方抽样方法
参数