一种可学习低秩双线性行为感知方法

AITNT
正文
推荐专利
一种可学习低秩双线性行为感知方法
申请号:CN202510547601
申请日期:2025-04-28
公开号:CN120071445B
公开日期:2025-07-01
类型:发明专利
摘要
本发明涉及图像或视频识别领域,尤其涉及一种可学习低秩双线性行为感知方法,包括:(1)建立以图像大模型为基础加入视频时空建模迁移至视频任务的框架;(2)在框架内构建视频行为识别模型,包括:视频编码器、多尺度聚合器、文本编码器、多任务解码器;(3)构建一种大模型主分支冻结仅新加参数学习的训练机制,利用服务器对视频行为识别模型进行训练,通过优化目标函数,直至网络收敛,获取局部最优网络参数,得到训练好的视频行为识别模型;(4)将待识别的视频序列输入到训练好的视频行为识别模型中识别人类行为。本发明的有益效果在于:能高精度地识别视频中的人类行为,在多个动作识别数据集中达到了先进的性能。
技术关键词
双线性 视频编码器 文本编码器 视频特征提取 适配器 解码器 跨模态 多任务 令牌 特征提取网络 识别人类 多模态 多尺度 图像 矩阵 语义特征提取 多级特征
系统为您推荐了相关专利信息
1
一种混合集成四向光收发器件
激光器芯片 激光器组件 准直透镜 圆方管体 半导体制冷器
2
升尺度的叶片水分利用效率图谱的获取方法以及装置
同位素 图谱 栅格 叶片 景观
3
基于多模态提示学习的零样本视频动作识别方法
视频动作识别方法 文本编码器 图像编码器 视频动作分类 多模态
4
一种文本对齐的人体运动生成方法及系统
运动生成方法 序列 重建人体 标记 文本编码器
5
一种无人机巡检输电线路断股导线的目标检测方法
文本编码器 浅层特征提取 语义分割网络 导线 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号