摘要
本发明请求保护一种基于度量的元学习视频行为识别方法,属于计算机视觉技术领域。获取查询视频,与支持集视频共同输入基于度量的元学习视频行为识别模型,根据度量分数输出视频行为识别结果。该模型包括原型表示学习阶段和视频分类阶段。其中原型表示学习阶段包括度量引导的视频级语义增强模块和时序建模模块,以及度量引导的关键语义提取模块,视频分类阶段利用双向时序集合匹配来度量查询视频与支持集视频的距离分数。本发明针对视频行为识别中难以分辨相似行为以及匹配方法不具通用性的问题,提高原型表示的鉴别性和匹配方法的泛化性,进而提升模型的泛化能力,行为识别结果更准确。
技术关键词
视频
原型
度量
识别方法
语义
特征提取网络
序列
时序
阶段
样本
计算机视觉技术
关键帧
模块
关系建模
视野
注意力
训练集
标签
数据
图像
系统为您推荐了相关专利信息
环境感知方法
起重机
静态障碍物
数据
动态障碍物
手语
树数据结构
分层建模方法
骨骼动画数据
预加载机制
大语言模型
多模态
系统管理方法
云桌面系统
容器
图像处理工具
图像标注方法
聚类
像素点
图像语义分割模型
识别方法
快速分析仪
深度相机
反演模型
三维点云数据