摘要
本申请公开了一种数据集获取方法和装置、电子设备、存储介质,涉及人工智能技术领域。该方法包括:通过伪标签生成模型对第一待检测图像和待检测类别的描述文本进行类别生成,得到第一伪标签数据集;对第一待检测图像集和第一伪标签数据集进行过滤,得到第一样本伪标签数据和第一样本图像;基于第一样本图像和第一样本伪标签数据对初始生产模型进行模型训练,得到第一生产模型;通过第一生产模型对第二待检测图像进行类别检测,得到第二伪标签数据集;对第二待检测图像集和第二伪标签数据进行过滤,得到第二样本伪标签数据和第二样本图像;最后进行数据整合,得到目标数据集。本申请能够进行扩充数据集包含的类别,且可以节约人力。
技术关键词
图像
样本
标签
数据集获取方法
文本
数据获取模块
过滤模块
模型训练模块
电子设备
可读存储介质
人工智能技术
数据更新
处理器
存储器
计算机
参数
人力
系统为您推荐了相关专利信息
铆接控制方法
图像特征信息
铆接机
摄像模块
视觉
压敏涂料
误差校正方法
三角网格数据
光线追踪技术
相机