一种双向域弥合的行为识别方法

正文

推荐专利

一种双向域弥合的行为识别方法

申请号：CN202411961209

申请日期：2024-12-30

公开号：CN119920000B

公开日期：2025-11-04

类型：发明专利

摘要

本发明涉及一种双向域弥合的行为识别方法，包括：获取待识别RGB图像帧序列及其类别文本；将所述待识别RGB图像帧序列输入文本提示生成模块得到生成式文本；将所述待识别RGB图像帧序列及其类别文本和所述生成式文本输入行为识别模型，得到所述待识别视频的动作类别，所述行为识别模型包括：第一文本编码器模块、图像编码器模块、时序编码器模块、第二文本编码器模块、交互模块、融合模块和相似度计算模块。本发明能够有效缩小预训练模型与行为识别任务之间的域差距，从而显著提升CLIP模型在行为识别领域的适用性和性能。

技术关键词

文本编码器识别方法图像嵌入编码器模块图像编码器运动主体图像转换单元序列时序卷积模块关键词融合特征前馈神经网络预训练模型注意力机制

系统为您推荐了相关专利信息

一种基于智能图像算法的葡萄粒纵横径识别方法

智能算法葡萄识别方法识别偏差间距

一种基于改进时空图卷积神经网络的人体行为识别方法及装置

时空图卷积神经网络识别方法关节特征视频采集系统神经网络建模技术

一种外墙保温板锚栓锚钉异常状态识别方法

锚栓异常状态识别方法锚钉实时视频图像

基于跨模态主动学习的电力设备缺陷数据标注方法及系统

电力设备缺陷数据标注方法数据标注系统跨模态主动学习策略

基于神经网络的生物有机肥菌种识别方法、系统及设备

生物有机肥融合特征跨模态多模态信息识别方法

一种双向域弥合的行为识别方法

站点导航

APP 下载