摘要
本发明涉及图像检索及挖掘技术领域,具体公开了一种图像搜索引擎的生成方法、图像检索方法和系统,包括构建视觉大语言模型并训练,获得训练好的视觉大语言模型;构建图像库,获取图像库中每幅图像的信息文本;将每幅图像及其对应的信息文本输入到训练好的视觉大语言模型中,获得每幅图像对应的文本描述;对文本描述进行分词,并提取每幅图像所对应的关键词;以及将每幅图像所对应的关键词创建倒排索引并写入搜索引擎,以生成基于视觉大语言模型的图像搜索引擎。该图像搜索引擎能用于挖掘新的物体类别,新的场景,无需进行额外的图像模型训练。
技术关键词
图像搜索引擎
大语言模型
文本
图像检索方法
关键词
生成方法
视觉特征提取
图像库
图片
图像检索系统
模块
数据
词语
挖掘技术
分词
移动物体
生成系统
系统为您推荐了相关专利信息
机器人检测方法
多模态网络
线性变换矩阵
社交
文本
大语言模型
分布式代理方法
记忆
环境感知信息
智能体技术
查询方法
关键字
语言模型技术
数据交换平台
自然语言