摘要
本发明公开了一种基于多模态Agent的图像分类数据构建方法,包括以下步骤:输入图像、数据集信息:包括:1)从多种渠道收集的图像数据、照片及视频格式,连同预期的图像分类数据集的详细信息;2)直接输入数据集名称;Agent将执行在线搜索并整合预训练的模型数据以检索相关的数据集信息;用户根据提示输入其需求后,Agent开始与大模型互动,使模型能够利用提供的操作制定满足用户需求的计划,并将根据制定的计划自动调用操作,完成指定任务。本发明实现了图像分类数据集扩展和创建的全自动化和批量处理,显著减少了人力消耗,降低了数据集扩充与创建成本。与传统方法相比提高了操作效率,同时保持了高度的准确性。
技术关键词
数据构建方法
图像
多模态
分辨率
计划
大语言模型
数据分布
文本
格式
渠道
照片
指令
在线
视频
记忆
批量
变量
标签
样本
系统为您推荐了相关专利信息
显微测量方法
卡尔曼滤波
扩展景深
测量点
旋转载物台
精确识别方法
图像采集设备
空间权重矩阵
指数
频率
特征提取网络
标签
残差模块
多尺度特征融合
融合特征