摘要
本发明涉及一种基于多智能体协同推理的零样本组合图像检索方法,包括如下步骤S1:输入参考图像与修改文本,采用预训练图像描述模型生成图像描述,S2:规划智能体根据设计的融合模版,生成检索目标描述,S3:检索智能体基于检索目标描述,计算余弦相似度,以在数据库中检索Top‑N候选集,S4:校正智能体对检索的op‑N候选集中的图片进行链式推理,链式推理中当不满足编辑操作时生成反馈,并重新执行步骤S2,当达到最大轮数时则输出最终检索结果Top‑N候选集;本发明具有提升复杂场景下的检索准确率与鲁棒性的优点。
技术关键词
多智能体协同
图像检索方法
样本
推理机制
检索图像
规划
大语言模型
校正
编辑
图片
模版
多阶段
文本
鲁棒性
编码器
动态
语义
实体
系统为您推荐了相关专利信息
文本
样本
梯度提升机
非暂态计算机可读存储介质
主成分分析降维
人形机器人
关节
样本
视觉感知特征
神经网络模型
人眼视觉特性
度评价方法
待测光源
综合评价指标
颜色
策略生成方法
饲料配方数据
瘤胃发酵
强化学习模型
样本