摘要
本发明公开了一种基于深度学习的人物行为识别方法,该方法是利用改进的GroundedSAM模型实现对人物行为的精准识别,该改进的GroundedSAM模型是对原来GroundedSAM模型的伪标签生成模块和运动特征提取模块进行改进;通过对标注的数据集中的行为标签进行语义扩展,构建动作关联库,用于精确模型的伪标签输入。结合光流信息提取运动特征优化模型的ROI感兴趣区域,并通过大语言模型生成自然语言描述。最终,采用双通道分类器进行动作预测与分类。本发明可显著提高识别精度,并有效降低视觉理解过程中的时间与计算成本。
技术关键词
标签
自然语言文本
识别方法
视频帧
语义
预训练语言模型
特征提取模块
感兴趣
像素点
检索技术
大语言模型
高维向量空间
生成自然语言
分类器
运动
分类规则
模板
系统为您推荐了相关专利信息
特征提取方法
抽象语法树
函数识别方法
特征数据库
索引
纺织品
训练样本集
物品识别模型
融合特征提取
物品识别标识
异质信息网络
胶囊网络
计算机程序指令
编码器
企业违约风险