摘要
本发明涉及图像处理技术领域,公开了一种图像数据集构建方法及系统,本方法包括利用多模态大模型CLIP识别现有图像数据集的缺陷,并进行补充;对补充后得到的图像数据集进行标注,并通过多层次的质量控制确保标注的准确性;对标注完成的图像数据集进行扩展;将扩展后得到的图像数据集与其他模态数据进行融合,完成最终图像数据集的构建。本发明提高了数据采集的精准性和标注的效率,提高了数据标注的准确性和一致性,减少了人为错误;本发明能够动态扩展数据集,使得数据集更加多样化,模型的泛化能力得以提升;本发明支持图像与其他模态的融合,利用大模型的跨模态对齐能力,增强了图像数据集的应用场景与灵活性。
技术关键词
多模态
智能数据采集模块
数据集构建系统
差分隐私技术
多层次
跨模态数据
生成数据集
生成对抗网络
标注策略
审核平台
场景
文本
图像嵌入
图像处理技术
评分系统
生成报告
区块链技术
系统为您推荐了相关专利信息
行人检测方法
跨尺度特征融合
编码模块
输出特征
通道
视觉特征
图像处理方法
计算机程序产品
计算机设备
分辨率
控制指令生成单元
塔台
状态监控系统
孤立森林算法
动态贝叶斯网络
深度语义分割网络
文本
注意力机制
图像处理模块
大语言模型