摘要
本发明公开了一种基于多智能体的影像分类方法及系统,方法包括:基于用户交互界面获取用户上传的图像和分类提示词;对接收到的图像进行预处理,并进行格式转换;基于大语言模型将分类提示词转换为对应的模型思考框架;基于模型思考框架分别调用视觉模型和搜索工具,并根据视觉识别结果和搜索结果确定分类结果;通过大语言模型判断分类结果是否满足模型思考框架,并在满足时向用户交互界面返回分类结果。通过本发明的技术方案,减少了单一模型对特定数据集的依赖,增强了不同任务的适应能力,能够灵活应对新规则和新场景,提高了影像分类的准确性和鲁棒性。
技术关键词
影像分类方法
大语言模型
搜索工具
分类系统
框架
分类规则
图像转换模块
视觉
答案
界面
格式
数据获取模块
逻辑
语义
图片
鲁棒性
场景
系统为您推荐了相关专利信息
大语言模型
图表
预训练语言模型
文本
结构化方法
防尾随门禁装置
门禁开关装置
门禁栏杆
压力杆
识别装置
异构系统数据
智能运维方法
异常数据
时间序列预测模型
数据同步