一种基于多模态Agent的图像分类数据构建方法

正文

推荐专利

申请号：CN202510082819

申请日期：2025-01-20

公开号：CN119992195A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了一种基于多模态Agent的图像分类数据构建方法，包括以下步骤：输入图像、数据集信息：包括：1)从多种渠道收集的图像数据、照片及视频格式，连同预期的图像分类数据集的详细信息；2)直接输入数据集名称；Agent将执行在线搜索并整合预训练的模型数据以检索相关的数据集信息；用户根据提示输入其需求后，Agent开始与大模型互动，使模型能够利用提供的操作制定满足用户需求的计划，并将根据制定的计划自动调用操作，完成指定任务。本发明实现了图像分类数据集扩展和创建的全自动化和批量处理，显著减少了人力消耗，降低了数据集扩充与创建成本。与传统方法相比提高了操作效率，同时保持了高度的准确性。

技术关键词

数据构建方法图像多模态分辨率计划大语言模型数据分布文本格式渠道照片指令在线视频记忆批量变量标签样本

系统为您推荐了相关专利信息

基于卡尔曼滤波的多视角补偿三维显微测量方法和系统

显微测量方法卡尔曼滤波扩展景深测量点旋转载物台

基于图形处理的电路分组分析方法、系统、终端及介质

图形处理电路分析方法递归算法像素点

一种用于灌区作物生长期精确识别方法及系统

精确识别方法图像采集设备空间权重矩阵指数频率

一种语义分割模型训练方法及装置

特征提取网络标签残差模块多尺度特征融合融合特征

一种基于动态负载均衡的区块链多模态事务打包方法

打包方法节点多模态数据处理场景音频

一种基于多模态Agent的图像分类数据构建方法

站点导航

APP 下载