基于多模态提示学习的零样本视频动作识别方法

AITNT
正文
推荐专利
基于多模态提示学习的零样本视频动作识别方法
申请号:CN202511017006
申请日期:2025-07-23
公开号:CN120932150A
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及一种基于多模态提示学习的零样本视频动作识别方法,主要提供了一种面向可泛化视频理解的多模态提示微调框架,该框架基于视觉‑语言预训练模型CLIP,通过柔和的提示微调策略,将CLIP模型在海量图像‑文本对上学习到的跨模态关联知识有效迁移至下游零样本视频动作识别任务;提示微调策略包括基于LoRA微调,跨帧提示微调以及上下文均衡微调。本申请能够提升模型的零样本识别能力和泛化能力。
技术关键词
视频动作识别方法 文本编码器 图像编码器 视频动作分类 多模态 视频特征提取 样本 生成动作 动作识别系统 注意力 标记 序列 模板 预训练模型 处理器 可读存储介质
系统为您推荐了相关专利信息
1
变电站一次设计图纸对应SSD模型生成方法和系统
图纸 变电站 模型生成方法 电力系统数字化 逻辑
2
一种患者赋权诊断辅助方法和系统
患者生理数据 诊断辅助方法 生物传感模块 生成知识图谱 诊断辅助系统
3
一种基于大语言模型可解释决策的智能面试评分系统
大语言模型 文本 多模态 语义 图谱
4
用于多层笼养鸡舍的巡检机器人的巡检方法及巡检平台
巡检机器人 笼养鸡舍 巡检平台 巡检方法 服务器
5
基于多模态数据的农业场景识别与验证方法及系统
基础分类器 农业 多模态 集成分类器 场景类别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号