摘要
本发明提供一种视觉语言目标检测数据自动标注方法及系统,属于视觉检测技术领域。本发明基于n‑gram算法通过自定义提示模板筛选图像,为用户提供了个性化的快速图像筛选方式,用户可根据自己的需求定义提示,从而快速的选择相关图像,并增强了搜索结果的相关性,在区域级与图像级层面联合过滤标注图像,解决开放世界目标检测模型可能存在的误检问题,提高了图像的标注质量。本发明可解决人工数据标注效率低下且成本高昂问题,能够快速高效的实现多模态目标检测数据集的构建。
技术关键词
数据自动标注方法
置信度阈值
列表
生成图像数据
抑制算法
视觉特征
文本编码器
图像编码器
多模态
独立编码器
海量互联网
模板
视觉检测技术
序列
双塔结构
语义
系统为您推荐了相关专利信息
蓝牙模块
数据传输模块
车辆数据传输方法
移动终端建立通信
列表
信息提取方法
词典
PageRank算法
文本
数据