摘要
本发明公开了一种图像搜索方法及装置,涉及人工智能技术领域,旨在解决传统图像搜索方法单一模态输入限制及搜索意图理解不足的问题,包括:首先获取用户输入的多模态搜索需求指令,该指令可包含文字需求和图像需求。在用户意图完整表达的情况下,将这些指令输入到预先训练的图像搜索智能体中进行任务拆分,得到至少一个待执行的任务。随后,图像搜索智能体调用各任务对应的目标模型执行这些任务,并获取执行结果。最后,基于这些结果从预设的离线图像库中提取目标图像,作为多模态搜索需求指令对应的图像搜索结果。如此设计,能够提升图像搜索的准确性和用户满意度,适用于多模态信息检索、智能推荐系统领域。
技术关键词
多模态
指令
图像搜索方法
对象识别模型
图像库
离线
关键点识别
图片
接口
大语言模型
图像搜索装置
存储结构
智能推荐系统
列表
搜索意图
文本
人工智能技术
系统为您推荐了相关专利信息
内窥成像系统
光纤内窥镜
包层光纤耦合器
荧光成像装置
内窥探头
深度滤波器
滤波器系数
卷积循环网络
语音特征提取
语音降噪方法
智能管理方法
料框
自动复位功能
触控一体机
AGV车载控制器