基于多模态知识图谱推理增强的人体行为识别方法及设备

正文

推荐专利

申请号：CN202510320959

申请日期：2025-03-18

公开号：CN120236331A

公开日期：2025-07-01

类型：发明专利

摘要

本发明公开了一种基于多模态知识图谱推理增强的人体行为识别方法及设备，涉及图像处理技术领域，包括：获取待识别的视频数据；对待识别的视频数据均匀采样，得到多个关键帧；采用训练好的人体行为识别网络对多个关键帧进行处理，利用视觉信息和文本信息之间的互补性，得到待识别的视频数据的类别结果；其中，训练好的人体行为识别网络以预设类别的数据作为训练集，对初始的人体行为识别网络进行训练得到。本发明能够提高模型的语义理解能力和时空建模能力。

技术关键词

知识图谱推理节点特征识别方法锚点多模态视觉人体语义表达式关键帧图像编码器网络数据多层感知机代表性视频帧文本编码器

系统为您推荐了相关专利信息

一种电子价签位置识别方法及系统

电子价签位置识别方法优化图像处理深度卷积神经网络多模态传感器

基于稳定扩散模型多模态生成技术的建筑设计方法与应用

建筑设计方法生成技术图像多模态融合机制文本

一种基于多模态大模型的视频检索问答方法及系统

问答方法多模态列表文本关键帧提取算法

一种颞下颌关节核磁片的自动阅片诊断系统

颞下颌关节诊断系统影像特征提取模块扩散加权成像

联合图像处理与语义理解的蠕变型滑坡隐患智能识别方法

蠕变型滑坡智能识别方法注意力机制文本语言编码器

基于多模态知识图谱推理增强的人体行为识别方法及设备

站点导航

APP 下载