一种可学习低秩双线性行为感知方法

正文

推荐专利

一种可学习低秩双线性行为感知方法

申请号：CN202510547601

申请日期：2025-04-28

公开号：CN120071445B

公开日期：2025-07-01

类型：发明专利

摘要

本发明涉及图像或视频识别领域，尤其涉及一种可学习低秩双线性行为感知方法，包括：（1）建立以图像大模型为基础加入视频时空建模迁移至视频任务的框架；（2）在框架内构建视频行为识别模型，包括：视频编码器、多尺度聚合器、文本编码器、多任务解码器；（3）构建一种大模型主分支冻结仅新加参数学习的训练机制，利用服务器对视频行为识别模型进行训练，通过优化目标函数，直至网络收敛，获取局部最优网络参数，得到训练好的视频行为识别模型；（4）将待识别的视频序列输入到训练好的视频行为识别模型中识别人类行为。本发明的有益效果在于：能高精度地识别视频中的人类行为，在多个动作识别数据集中达到了先进的性能。

技术关键词

双线性视频编码器文本编码器视频特征提取适配器解码器跨模态多任务令牌特征提取网络识别人类多模态多尺度图像矩阵语义特征提取多级特征

系统为您推荐了相关专利信息

一种混合集成四向光收发器件

激光器芯片激光器组件准直透镜圆方管体半导体制冷器

升尺度的叶片水分利用效率图谱的获取方法以及装置

同位素图谱栅格叶片景观

基于多模态提示学习的零样本视频动作识别方法

视频动作识别方法文本编码器图像编码器视频动作分类多模态

一种文本对齐的人体运动生成方法及系统

运动生成方法序列重建人体标记文本编码器

一种无人机巡检输电线路断股导线的目标检测方法

文本编码器浅层特征提取语义分割网络导线模块

一种可学习低秩双线性行为感知方法

站点导航

APP 下载