摘要
本申请公开了基于跨批元优化和高斯自集成的开放词汇行为识别方法、装置、介质和设备,通过获取待处理视频帧序列;利用预训练的开放词汇行为识别模型中处理所述待处理视频帧序列,得到识别后的行为;输出识别后的行为;本申请在对视频学习模型进行视频微调过程中引入跨批元优化方法以及对模型参数进行高斯自集成,高效促进视频模型从“已知”到“开放”的通用性提升以及从“图像”到“视频”信息的去偏增强,以实现更鲁棒的通用性。
技术关键词
学习器
识别方法
视觉
集成训练
参数
视频帧
文本编码器
训练集数据
传播算法
输入输出单元
序列
存储计算机程序
阶段
电子设备
存储器
识别装置
输出模块
系统为您推荐了相关专利信息
轨迹误差
激光扫描仪
数学模型
三次样条插值
锯切刀片
交叉注意力机制
线性变换矩阵
视觉
适配器
Softmax函数
频段
无线通信方法
智能门锁
分数阶
模糊隶属度函数
泥石流流量
岩土体
FBG传感器
加速度
反演模型
合金镀层钢丝
合金镀层钢板
桥梁拉索
模型构建方法
速率