摘要
本发明涉及基于大模型的图像数据快速筛选方法及装置,该方法包括:获取图像数据和预设的提示词模版,调用BERT模型对提示词模版进行预推理,对提示词模版进行分词标记,生成相应的提示词特征向量。通过循环推理代码循环读取图像数据和提示词特征向量,将图像数据和提示词特征向量作为VisualGLM‑6b多模态大模型的输入,输出视觉特征和语义信息。通过图像文本匹配技术基于视觉特征和语义信息计算图像数据和文本数据的匹配序列,通过后处理代码对匹配序列进行处理,解析匹配序列中图像数据与提示词的匹配分数和置信度分数。当匹配分数超过预设的动态阈值且置信度分数超过第一阈值时,筛选并确定包含目标提示词的图像数据。
技术关键词
快速筛选方法
文本匹配技术
BERT模型
视觉特征
模版
序列
分词
文本特征向量
语义
标记
快速筛选装置
读取图像数据
多模态
后处理模块
文本编码器
图像编码器
计算机存储介质
系统为您推荐了相关专利信息
深度强化学习
压力传感器阵列
视觉特征
数据
真实系统
建筑群
约束优化模型
人口统计数据
分区
BERT模型