摘要
本发明公开了一种人工智能对实时视频流的交互式辅助标注方法,涉及计算机视觉和人工智能技术领域,包括:步骤1:采集多组标注目标的若干张图像;步骤2:标注所有图像中目标的标注边界框和标签,并进行下采样,构建训练图像集;步骤3:采用数据增强方法对训练图像集中图像进行增强,构建增强图像集;步骤4:结合单次多框检测器与MobileNetV2模型构建IMNet‑SSD模型,使用增强图像集对IMNet‑SSD模型进行训练,获得视频流标注模型;步骤5:采集待标注实时视频,将待标注实时视频输入至视频流标注模型中,输出预标注视频帧;步骤6:对预标注视频帧进行筛选验证,获得标注视频。本发明采用模型辅助的交互式标注减少专家标注的溢出和延迟,提高了标注的一致性和效率。
技术关键词
辅助标注方法
实时视频流
图像
多尺度特征融合
视频帧
检测器
残差模块
标签
人工智能技术
线性
计算机视觉
瓶颈
饱和度
数据
基础
系统为您推荐了相关专利信息
偏心
示教位置
特征轮廓
机器人工具坐标系
计算机程序产品
热成像
视觉识别系统
AI摄像头
可见光图像
识别模组
光谱解混方法
解码器
重构
卷积神经网络提取
代表