摘要
本公开提供了一种面向安检领域的多模态大模型检索方法、装置、电子设备、存储介质和程序产品。该方法包括:接收包括目标文本和目标图像的用户输入,以及按照检索增强流程处理用户输入。其中,先在安检数据库中检索目标图像中待识别的第一图像块,得到第一检索结果,该第一检索结果包括至少一个第一安检图像和第一安检图像中与第一图像块匹配成功的图像块的第一文本记录数据;然后利用第一提示词提示大模型根据第一检索结果中的第一文本记录数据确定出第一图像块中的货物种类,以得到第一货物识别结果;接着利用预设的第二提示词提示大模型结合第一货物识别结果,生成针对目标文本的第一答复内容。
技术关键词
安检图像
图像块
意图类别
模型检索方法
文本
后处理模块
违禁品
模型检索装置
非结构化数据库
图像纹理特征
意图识别模型
图像分割
机器学习模型
计算机程序产品
处理器
信息检索
电子设备
系统为您推荐了相关专利信息
情感分析方法
视觉特征
文本
多模态交互
精确定位图像
文本编码器
推送方法
信息处理
案例库
地理位置信息
替换图像背景
背景图
计算机可执行指令
计算机程序产品
文本