基于多模态关键语义的无监督骨架行为识别方法及系统

正文

推荐专利

申请号：CN202411811914

申请日期：2024-12-10

公开号：CN119785422B

公开日期：2025-09-16

类型：发明专利

摘要

本发明提供一种基于多模态关键语义的无监督骨架行为识别方法及系统，本发明方法包括：采集预训练的多模态骨架视频序列，进行预处理，构建骨架数据集；利用多模态大语言模型对骨架数据集中的每一类动作图像进行时序理解，并生成关键描述，通过语义编码器生成文本描述特征簇；通过混合增强策略和时空图卷积ST‑GCN模型捕捉骨架数据集中图片的骨架动作特征簇；利用GLIP语义对齐策略，将文本描述特征簇和骨架动作特征簇映射至同一个表征空间，将不同动作进行相似性比较，利用反向传播训练骨架编码器，实现骨架行为识别。

技术关键词

动作特征识别方法 GCN模型大语言模型语义文本特征向量混合骨架图像采集单元特征提取单元节点输出特征人体骨架编码器数据策略序列多模态特征融合邻居

基于多模态关键语义的无监督骨架行为识别方法及系统

站点导航

APP 下载