摘要
本发明涉及一种基于视觉大模型的缺陷数据集辅助标注方法,包括:步骤1、获取含缺陷的CT切片图像,将CT切片图像进行裁剪处理,获取图像数据集;步骤2、对数据集中的少量数据进行手工标注,获取人工标注图像,并生成点提示和框提示;步骤3、将图像数据集、点提示和框提示输入视觉大模型,获取缺陷预测图像;步骤4、设置目标阈值,将缺陷预测图像与人工标注图像进行定量对比,判断对比结果是否满足目标阈值,若满足目标阈值,则获取最优视觉大模型;若未满足目标阈值,则返回步骤2,增加点提示,直至获取最优视觉大模型;步骤5、将数据集中的剩余数据输入最优视觉大模型,结合点提示信息,获取大量目标缺陷标注数据集。
技术关键词
辅助标注方法
缺陷预测
视觉
图像嵌入
数据
图像解码器
图像编码器
CT切片图像
位置编码单元
注意力机制
结合点
坐标
图像分割
手工
分辨率
系统为您推荐了相关专利信息
光伏发电模块
光伏储能
模糊PID算法
节能系统
储能模块
光伏功率预测方法
LightGBM模型
序列
变分模态分解算法
XGBoost模型
储能协调控制方法
智能控制算法
储能系统
场景
指标
文本分类方法
BERT模型
生成文本摘要
优化器
多头注意力机制