摘要
一种基于文本特征引导的动态参数调整小样本行为识别方法,涉及计算机视觉技术。给定视频数据集,将每个视频随机抽取帧构成新视频帧序列,输入视觉特征提取器;传统线性层重构可扩展的基矩阵库,每个线性层解耦为多组基参数矩阵,每个基参数矩阵共同构成参数空间基底。视频帧序列的标签通过文本模板输入文本特征提取器得文本特征。文本特征输入坐标向量计算模块利用文本信息作为语义引导,通过生成多个参数矩阵的组合系数构建适用于特定任务的线性层参数。计算质心互斥损失和对比聚类损失,实现基参数矩阵组间高内聚和低耦合的特性。将特征提取器得到的视频特征输入预测器,得到预测结果,计算损失函数并更新梯度。提升分类性能。
技术关键词
文本
矩阵
参数
识别方法
视频帧
视觉特征提取
适配器
动态
线性
坐标
样本
特征提取器
序列
语义
模块
计算机视觉技术
聚类
多模态
重构
系统为您推荐了相关专利信息
预警系统
云端数据处理
农村
机器学习模型
数据采集模块
动态均衡控制方法
拓扑网络
电池
强化学习模型
开关
变电站故障
自动测试方法
机器学习模型
继电保护测试
机器学习训练
光功率
图像识别方法
分类特征
灰度矩阵
图像识别程序