摘要
本发明公开了一种基于多类昆虫图像训练数据集高效标注方法,涉及图像处理技术领域,其技术方案要点是:包括以下步骤:S0:预处理多类昆虫图像数据集;S1:构建通用的昆虫检测器GInsectD;S2:裁剪生成具有唯一索引的昆虫目标小图;S3:使用自监督学习方法DEIP学习到良好的特征表示;S4:使用层次聚类算法分类目标小图;S5:将分类好的目标小图回溯到原图形成最终的目标检测数据集。本发明通过对开放词汇目标检测器进行了修改与微调,使其能够很好的检测各种多类昆虫图像,展现出强大的泛化性能,能够作为通用的昆虫检测器去定位出多类昆虫图像上面的所有昆虫,通过借助通用的昆虫检测器与自监督表征学习,极大摆脱对人工资源的需求量,也提高了数据集的标记效率。
技术关键词
高效标注方法
监督学习方法
层次聚类算法
检测器
训练数据集标注
层次聚类方法
索引
双编码器
标注软件
分类结构
图像处理技术
网络特征
评估算法
信息更新
多模态
解码器
标签
坐标