基于yolo与RoiMViTv2的多目标视频行为识别方法

正文

推荐专利

申请号：CN202511012571

申请日期：2025-07-22

公开号：CN121033100A

公开日期：2025-11-28

类型：发明专利

摘要

本申请提供了基于yo lo与RoiMViTv2的多目标视频行为识别方法，涉及人工智能、计算机视觉的动作识别与目标追踪技术领域，包括：将原始视频拆分为多个单帧图像序列，通过YOLOv11检测算法进行处理，得到每帧图像的候选目标区域；使用DeepSort算法对候选目标区域进行跨帧关联，以得到每个目标的跨帧轨迹；将多个单帧图像序列通过MViTv2模型捕捉全局时空依赖关系，生成全图特征；基于全图特征和跨帧轨迹，进行坐标缩放和时空对齐操作，得到特征张量；对特征张量进行时序和空间的池化操作以及分类头处理，生成每个目标的最高概率标签及置信度。

技术关键词

视频图像 Softmax函数识别方法轨迹算法标签压缩特征序列处理器坐标计算机视觉生成特征时序注意力机制输出特征程序可读存储介质关系存储器

系统为您推荐了相关专利信息

一种多模态乳腺癌风险评估方法及系统

乳腺癌风险评估多模态算法模型风险评估技术矩阵

一种基于行为分析的电子围栏安全控制方法及系统

电子围栏设备安全控制方法视频监控设备视频监控数据传输异常事件

一种基于人工智能的输电线绝缘子故障检测方法及装置

输电线绝缘子故障检测模型故障检测方法上采样 Sigmoid函数

一种钢铁工业物料钢印字符识别方法、设备及存储介质

钢印字符识别方法 Retinex理论光照字符识别模型图像增强模型

一种基于YOLO模型的道路坑洞测量方法及装置

道路坑洞 YOLO模型原始图像数据无人机图像采集图像分割模型

基于yolo与RoiMViTv2的多目标视频行为识别方法

站点导航

APP 下载