一种姿态驱动的人物交互行为多层感知方法及系统

正文

推荐专利

申请号：CN202411871328

申请日期：2024-12-18

公开号：CN119649464A

公开日期：2025-03-18

类型：发明专利

摘要

本发明提出一种姿态驱动的人物交互行为多层感知方法及系统，属于计算机视觉、行为识别领域，包括：S1：输入图片通过AFE模块进行特征提取，再通过扁平化操作得到图像特征嵌入R；S2：通过人体姿态检测方法获取输入图片的骨骼关键点，经过AGCN模块将骨骼关键点生成姿态嵌入P；S3：将R和P输入跨域特征融合模块进行融合嵌入，获得融合特征F；S4：将融合特征F、图像位置编码和HOI查询输入Transformer模型，得到输出嵌入D；采用多个多层感知机（MLP）分支将D解码为五元组HOI实例，并预测人物之间的交互行为。本发明方法旨在解决现有技术人体姿态信息缺乏，人物交互动作识别精确度较低的问题。

技术关键词

人体姿态检测方法骨骼关键点融合特征图片姿态特征记忆特征交互动作识别注意力神经网络单元图像解码编码器人体关键点通道多层感知机残差模块感知系统计算机视觉

系统为您推荐了相关专利信息

拼装积木模型的生成方法、装置、设备及存储介质

拼装积木贴图积木块生成方法矢量图

电子设备、车辆、方法及计算机程序产品

轨迹预测模型障碍物图片电子设备计算机程序产品

基于原型匹配的文本信息引导的自进化目标检测方法

原型文本编码器注意力机制跨模态图像编码器

多模态目标重识别学习方法、系统、装置以及可读介质

学习方法多模态特征视觉全局平均池化图像

一种基于电信规范多模态知识图谱的图检索增强生成方法

电信多模态三元组生成方法层级

一种姿态驱动的人物交互行为多层感知方法及系统

站点导航

APP 下载