摘要
本发明提供图像训练数据集的构建方法、装置和存储介质,涉及人工智能技术领域。所述方法包括:获取第一样本图像数据集,对第一样本图像数据集中的第一样本图像进行识别获得类别描述信息;基于第一样本图像数据集中的至少部分第一样本图像的类别描述信息进行聚类操作,得到至少一个样本图像簇,样本图像簇中的第一样本图像具有相同的聚类标签;基于第一样本图像数据集中的其它第一样本图像与每个样本图像簇中第一样本图像的相似度进行归类处理,以将其它第一样本图像归类到对应的样本图像簇中;基于归类处理后的样本图像簇获得图像训练数据集。所述方法实现自动从大量图像中进行标注,区分出图像所属的领域,能够减少人工挑选的工作量、提高效率。
技术关键词
样本
多模态图像数据
一致性检测
大语言模型
聚类
格式化
计算机存储介质
人工智能技术
数据获取模块
标签
处理器
图文
存储器
电子设备
工作量
视觉
系统为您推荐了相关专利信息
图像特征向量
仿生无人机
智能识别方法
加权特征
训练神经网络
视频帧
数据检测方法
子模块
机器学习模型
录屏数据
航班运行控制系统
异常事件
日志
长短期记忆神经网络
神经网络模型