一种基于大语言模型的图像跨模态检索方法、设备及介质

AITNT
正文
推荐专利
一种基于大语言模型的图像跨模态检索方法、设备及介质
申请号:CN202510010670
申请日期:2025-01-03
公开号:CN119938972A
公开日期:2025-05-06
类型:发明专利
摘要
本申请公开了一种基于大语言模型的图像跨模态检索方法、设备及介质,方法包括:通过BLIP模型生成原始图像对应的文本描述,将文本描述转换为对应的图像向量;建立图像向量和原始图像之间的映射关系,将映射关系以及图像向量存储至预设的向量数据库;获取用户提交的图像查询描述,通过预设的语言大模型,对图像查询描述进行优化,并将优化后的图像查询描述转换为对应的查询向量;根据向量数据库中各图像向量与查询向量之间的第一相似度,确定图像查询描述对应的若干待选图像;计算图像查询描述和若干待选图像之间的匹配度,根据匹配度,从若干待选图像中筛选出满足图像查询描述的目标图像。
技术关键词
大语言模型 文本 计算机可执行指令 指定图像格式 检索设备 关系 解码器 注意力机制 处理器通信 跨模态 比率 存储器 介质 像素 编码
系统为您推荐了相关专利信息
1
信息处理方法、设备、存储介质及程序产品
界面 数据 服务端 场景 文本
2
一种针对低碳建筑的运行诊断管控方法、设备及介质
可再生能源 能源需求量 能耗预测模型 管控方法 热能
3
元数据处理方法、计算机设备及可读存储介质
大语言模型 非结构化文本处理 元数据处理方法 样本 计算机设备
4
用于文档内容识别和智能段落章节拆解的方法及系统
分块 字符 序列 节点 图片
5
一种基于交互问答式模型获取文本的方法、装置及介质
关键词 策略 高斯滤波器 模块 语义分析能力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号