一种基于图片文本大模型的多目标样本自动化标注方法

正文

推荐专利

申请号：CN202410967783

申请日期：2024-07-18

公开号：CN120932033A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及多目标样本自动化标注技术领域，具体地说，涉及一种基于图片文本大模型的多目标样本自动化标注方法。其包括以下步骤：S1、用开集目标检测算法GroundingDIN0对图片文本进行检测，利用模型权重输出图片中对应的检测框；S2、用非最大抑制方法对检测框去重，保留GroundingDINO输出目标类别中置信度最大的类别和检测框；S3、将检测框信息和标签信息存入到标注平台需要的格式。该一种基于图片文本大模型的多目标样本自动化标注方法中，通过开集目标检测算法GroundingDIN0，有效且准确的对图片中的多目标样本自动化标注，只需要针对不太贴合的检测框进行稍微调整即可，大大减轻了标注人员的工作量，提高了标注的准确性。

技术关键词

标注方法文本图片样本标注平台注意力机制前馈神经网络编码器标注技术算法解码器编码向量视觉特征语义特征动态更新格式图像跨模态列表标签

系统为您推荐了相关专利信息

一种高速飞行体多阶段轨迹不确定性传播方法

飞行体多阶段轨迹模型拉丁超立方采样三自由度运动

基于大语言模型的施工图集最优方案评估方法及系统

大语言模型分块做法图谱文本识别技术

商品显示方法、装置、电子设备及介质

商品显示方法贴图基础模型库三维模型

样本生成方法、大语言模型的训练方法、交互方法及装置

大语言模型文本解码器点击率样本生成方法

一种基于拉曼光谱的检测胶质瘤组织样本中ATRX基因突变的方法及装置

检测胶质瘤胶质瘤组织拉曼光谱数据样本光谱分析仪

一种基于图片文本大模型的多目标样本自动化标注方法

站点导航

APP 下载