摘要
本发明实施例提供了一种对象行为识别方法、模型训练方法、装置及电子设备,涉及视频处理技术领域。对象行为识别方法包括:获取待识别视频;将待识别视频输入预先训练的对象行为识别模型中的视频特征提取网络,得到待识别视频的全局时域特征和全局空间特征,作为待处理特征;利用第一特征提取网络,提取待识别视频中待识别对象所占图像区域的图像特征,作为待识别对象的外观特征;对待识别对象的外观特征和待处理特征进行特征融合,得到对象形态适应特征;基于第一大语言模型对待识别特征进行深层特征提取,得到待识别对象的目标行为识别结果,降低画风差异带来的干扰,提高对象行为识别模型的泛用性。
技术关键词
深层特征提取
大语言模型
样本
对象
特征提取网络
识别特征
视频特征提取
多层感知机
融合特征
形态
时域特征
特征提取模块
模型训练方法
分类网络
标签
识别方法
图像
注意力机制
系统为您推荐了相关专利信息
缺陷检测方法
语义分割网络
生成图像数据
编码器
扩展模块
诱捕方法
层次聚类算法
协议
加密
残差注意力机制
特征选择方法
灰狼优化算法
机制
特征选择设备
控制策略
表情识别方法
多信息
融合特征
运动特征
特征提取模块