基于大模型的图像数据快速筛选方法及装置

AITNT
正文
推荐专利
基于大模型的图像数据快速筛选方法及装置
申请号:CN202411462569
申请日期:2024-10-18
公开号:CN119377434A
公开日期:2025-01-28
类型:发明专利
摘要
本发明涉及基于大模型的图像数据快速筛选方法及装置,该方法包括:获取图像数据和预设的提示词模版,调用BERT模型对提示词模版进行预推理,对提示词模版进行分词标记,生成相应的提示词特征向量。通过循环推理代码循环读取图像数据和提示词特征向量,将图像数据和提示词特征向量作为VisualGLM‑6b多模态大模型的输入,输出视觉特征和语义信息。通过图像文本匹配技术基于视觉特征和语义信息计算图像数据和文本数据的匹配序列,通过后处理代码对匹配序列进行处理,解析匹配序列中图像数据与提示词的匹配分数和置信度分数。当匹配分数超过预设的动态阈值且置信度分数超过第一阈值时,筛选并确定包含目标提示词的图像数据。
技术关键词
快速筛选方法 文本匹配技术 BERT模型 视觉特征 模版 序列 分词 文本特征向量 语义 标记 快速筛选装置 读取图像数据 多模态 后处理模块 文本编码器 图像编码器 计算机存储介质
系统为您推荐了相关专利信息
1
一种面向遥感多时相场景多任务解译的变化通用模型构建方法
通用模型构建方法 多任务 编码器 视觉特征 文本
2
文本生成方法、文本生成装置、电子设备及存储介质
文本生成方法 答案 节点 标识 树形结构
3
编码多层膜滤波阵列结构、光谱成像芯片及其制备方法
滤波阵列 滤波单元 编码 多层膜 光谱成像芯片
4
一种电梯防卷入控制方法、系统
深度强化学习 压力传感器阵列 视觉特征 数据 真实系统
5
城市建筑群立体功能分区及楼层人口动态分布方法及装置
建筑群 约束优化模型 人口统计数据 分区 BERT模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号