基于大模型的图像数据快速筛选方法及装置

正文

推荐专利

基于大模型的图像数据快速筛选方法及装置

申请号：CN202411462569

申请日期：2024-10-18

公开号：CN119377434A

公开日期：2025-01-28

类型：发明专利

摘要

本发明涉及基于大模型的图像数据快速筛选方法及装置，该方法包括：获取图像数据和预设的提示词模版，调用BERT模型对提示词模版进行预推理，对提示词模版进行分词标记，生成相应的提示词特征向量。通过循环推理代码循环读取图像数据和提示词特征向量，将图像数据和提示词特征向量作为VisualGLM‑6b多模态大模型的输入，输出视觉特征和语义信息。通过图像文本匹配技术基于视觉特征和语义信息计算图像数据和文本数据的匹配序列，通过后处理代码对匹配序列进行处理，解析匹配序列中图像数据与提示词的匹配分数和置信度分数。当匹配分数超过预设的动态阈值且置信度分数超过第一阈值时，筛选并确定包含目标提示词的图像数据。

技术关键词

快速筛选方法文本匹配技术 BERT模型视觉特征模版序列分词文本特征向量语义标记快速筛选装置读取图像数据多模态后处理模块文本编码器图像编码器计算机存储介质

系统为您推荐了相关专利信息

一种面向遥感多时相场景多任务解译的变化通用模型构建方法

通用模型构建方法多任务编码器视觉特征文本

文本生成方法、文本生成装置、电子设备及存储介质

文本生成方法答案节点标识树形结构

编码多层膜滤波阵列结构、光谱成像芯片及其制备方法

滤波阵列滤波单元编码多层膜光谱成像芯片

一种电梯防卷入控制方法、系统

深度强化学习压力传感器阵列视觉特征数据真实系统

城市建筑群立体功能分区及楼层人口动态分布方法及装置

建筑群约束优化模型人口统计数据分区 BERT模型

基于大模型的图像数据快速筛选方法及装置

站点导航

APP 下载