一种人工智能对实时视频流的交互式辅助标注方法

正文

推荐专利

申请号：CN202510519947

申请日期：2025-04-24

公开号：CN120431506A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了一种人工智能对实时视频流的交互式辅助标注方法，涉及计算机视觉和人工智能技术领域，包括：步骤1：采集多组标注目标的若干张图像；步骤2：标注所有图像中目标的标注边界框和标签，并进行下采样，构建训练图像集；步骤3：采用数据增强方法对训练图像集中图像进行增强，构建增强图像集；步骤4：结合单次多框检测器与MobileNetV2模型构建IMNet‑SSD模型，使用增强图像集对IMNet‑SSD模型进行训练，获得视频流标注模型；步骤5：采集待标注实时视频，将待标注实时视频输入至视频流标注模型中，输出预标注视频帧；步骤6：对预标注视频帧进行筛选验证，获得标注视频。本发明采用模型辅助的交互式标注减少专家标注的溢出和延迟，提高了标注的一致性和效率。

技术关键词

辅助标注方法实时视频流图像多尺度特征融合视频帧检测器残差模块标签人工智能技术线性计算机视觉瓶颈饱和度数据基础

系统为您推荐了相关专利信息

偏心机器人旋转中心的确定方法、设备、介质及程序产品

偏心示教位置特征轮廓机器人工具坐标系计算机程序产品

车载AI摄像头视觉识别系统

热成像视觉识别系统 AI摄像头可见光图像识别模组

一种基于改进Unet的全视野特征融合裂缝分割方法

裂缝分割方法解码器编码器视野网络

一种基于深度学习的智适应曝气管控方法及系统

管控方法氨氮曝气池顶点流速

基于端元查询设计与Transformer注意力机制的盲高光谱解混方法和系统

光谱解混方法解码器重构卷积神经网络提取代表

一种人工智能对实时视频流的交互式辅助标注方法

站点导航

APP 下载