图像训练数据集的构建方法、装置和存储介质

正文

推荐专利

申请号：CN202510755584

申请日期：2025-06-06

公开号：CN120580538A

公开日期：2025-09-02

类型：发明专利

摘要

本发明提供图像训练数据集的构建方法、装置和存储介质，涉及人工智能技术领域。所述方法包括：获取第一样本图像数据集，对第一样本图像数据集中的第一样本图像进行识别获得类别描述信息；基于第一样本图像数据集中的至少部分第一样本图像的类别描述信息进行聚类操作，得到至少一个样本图像簇，样本图像簇中的第一样本图像具有相同的聚类标签；基于第一样本图像数据集中的其它第一样本图像与每个样本图像簇中第一样本图像的相似度进行归类处理，以将其它第一样本图像归类到对应的样本图像簇中；基于归类处理后的样本图像簇获得图像训练数据集。所述方法实现自动从大量图像中进行标注，区分出图像所属的领域，能够减少人工挑选的工作量、提高效率。

技术关键词

样本多模态图像数据一致性检测大语言模型聚类格式化计算机存储介质人工智能技术数据获取模块标签处理器图文存储器电子设备工作量视觉

系统为您推荐了相关专利信息

一种跨模态语义对齐和特征融合的仿生无人机与飞鸟智能识别方法

图像特征向量仿生无人机智能识别方法加权特征训练神经网络

结合短期互补特性分析的多能源电力调控方法及系统

电力调控方法序列样本工业园区功率

一种数据检测方法、装置及电子设备

视频帧数据检测方法子模块机器学习模型录屏数据

一种基于医院重点区域场景的特殊患者身份重识别方法

重识别方法患者深度神经网络身份场景

一种航班运行控制系统的日志异常事件识别方法、装置、设备及介质

航班运行控制系统异常事件日志长短期记忆神经网络神经网络模型

图像训练数据集的构建方法、装置和存储介质

站点导航

APP 下载