一种双向域弥合的行为识别方法

AITNT
正文
推荐专利
一种双向域弥合的行为识别方法
申请号:CN202411961209
申请日期:2024-12-30
公开号:CN119920000B
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及一种双向域弥合的行为识别方法,包括:获取待识别RGB图像帧序列及其类别文本;将所述待识别RGB图像帧序列输入文本提示生成模块得到生成式文本;将所述待识别RGB图像帧序列及其类别文本和所述生成式文本输入行为识别模型,得到所述待识别视频的动作类别,所述行为识别模型包括:第一文本编码器模块、图像编码器模块、时序编码器模块、第二文本编码器模块、交互模块、融合模块和相似度计算模块。本发明能够有效缩小预训练模型与行为识别任务之间的域差距,从而显著提升CLIP模型在行为识别领域的适用性和性能。
技术关键词
文本编码器 识别方法 图像嵌入 编码器模块 图像编码器 运动主体 图像转换单元 序列 时序 卷积模块 关键词 融合特征 前馈神经网络 预训练模型 注意力机制
系统为您推荐了相关专利信息
1
一种基于智能图像算法的葡萄粒纵横径识别方法
智能算法 葡萄 识别方法 识别偏差 间距
2
一种基于改进时空图卷积神经网络的人体行为识别方法及装置
时空图卷积神经网络 识别方法 关节特征 视频采集系统 神经网络建模技术
3
一种外墙保温板锚栓锚钉异常状态识别方法
锚栓 异常状态 识别方法 锚钉 实时视频图像
4
基于跨模态主动学习的电力设备缺陷数据标注方法及系统
电力设备缺陷 数据标注方法 数据标注系统 跨模态 主动学习策略
5
基于神经网络的生物有机肥菌种识别方法、系统及设备
生物有机肥 融合特征 跨模态 多模态信息 识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号