一种基于图片文本大模型的多目标样本自动化标注方法

AITNT
正文
推荐专利
一种基于图片文本大模型的多目标样本自动化标注方法
申请号:CN202410967783
申请日期:2024-07-18
公开号:CN120932033A
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及多目标样本自动化标注技术领域,具体地说,涉及一种基于图片文本大模型的多目标样本自动化标注方法。其包括以下步骤:S1、用开集目标检测算法GroundingDIN0对图片文本进行检测,利用模型权重输出图片中对应的检测框;S2、用非最大抑制方法对检测框去重,保留GroundingDINO输出目标类别中置信度最大的类别和检测框;S3、将检测框信息和标签信息存入到标注平台需要的格式。该一种基于图片文本大模型的多目标样本自动化标注方法中,通过开集目标检测算法GroundingDIN0,有效且准确的对图片中的多目标样本自动化标注,只需要针对不太贴合的检测框进行稍微调整即可,大大减轻了标注人员的工作量,提高了标注的准确性。
技术关键词
标注方法 文本 图片 样本 标注平台 注意力机制 前馈神经网络 编码器 标注技术 算法 解码器 编码向量 视觉特征 语义特征 动态更新 格式 图像 跨模态 列表 标签
系统为您推荐了相关专利信息
1
一种高速飞行体多阶段轨迹不确定性传播方法
飞行体 多阶段 轨迹模型 拉丁超立方采样 三自由度运动
2
基于大语言模型的施工图集最优方案评估方法及系统
大语言模型 分块 做法 图谱 文本识别技术
3
商品显示方法、装置、电子设备及介质
商品显示方法 贴图 基础 模型库 三维模型
4
样本生成方法、大语言模型的训练方法、交互方法及装置
大语言模型 文本 解码器 点击率 样本生成方法
5
一种基于拉曼光谱的检测胶质瘤组织样本中ATRX基因突变的方法及装置
检测胶质瘤 胶质瘤组织 拉曼光谱数据 样本 光谱分析仪
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号