一种基于端到端转换器模型的视频时空动作定位方法及系统

正文

推荐专利

申请号：CN202410959627

申请日期：2024-07-17

公开号：CN119107577A

公开日期：2024-12-10

类型：发明专利

摘要

本发明公开了一种基于端到端转换器模型的视频时空动作定位方法及系统，涉及计算机视觉领域，方法包括：建立视频时空动作定位模型，获取用于训练视频时空动作定位模型的视频数据集，并定义算法目标；提取所述视频数据集中的时空特征；基于时空特征在解码器网络上反馈查询生成动作检测框；基于生成的动作检测框定义损失函数，基于损失函数训练视频时空动作定位模型，并使用所述模型对输入视频进行时空动作定位；本发明提出了端到端的处理方法，引入了编码器解码器结构充分挖掘视频的时空信息，在智能视频分析系统里具有良好的应用价值，能够有效提升下游任务的准确度。

技术关键词

动作定位方法转换器计算机可执行指令生成动作代表智能视频分析系统视频时空特征人工标记多层感知网络定义编码器解码器交叉注意力机制多头注意力机制算法参数解码网络

系统为您推荐了相关专利信息

一种面向多智能合约漏洞检测的门控终身学习方法

智能合约漏洞学习方法门控循环单元更新模型参数表达式

一种光伏组件寿命预测方法及系统

光伏组件滑动窗口退化模型特征长度尺度寿命预测系统

一种高速公路的能见度反演方法

反演方法摄像头坐标系高速公路能见度车道二值化图像

考虑运行稳健性的制造系统选择性维修决策优化方法

维修决策优化粒子设备维修数据系统设备算法模型

视频时刻定位的方法、装置、设备及介质

视频文本计算机可读指令转换器模块样本

一种基于端到端转换器模型的视频时空动作定位方法及系统

站点导航

APP 下载