一种姿态驱动的人物交互行为多层感知方法及系统

AITNT
正文
推荐专利
一种姿态驱动的人物交互行为多层感知方法及系统
申请号:CN202411871328
申请日期:2024-12-18
公开号:CN119649464A
公开日期:2025-03-18
类型:发明专利
摘要
本发明提出一种姿态驱动的人物交互行为多层感知方法及系统,属于计算机视觉、行为识别领域,包括:S1:输入图片通过AFE模块进行特征提取,再通过扁平化操作得到图像特征嵌入R;S2:通过人体姿态检测方法获取输入图片的骨骼关键点,经过AGCN模块将骨骼关键点生成姿态嵌入P;S3:将R和P输入跨域特征融合模块进行融合嵌入,获得融合特征F;S4:将融合特征F、图像位置编码和HOI查询输入Transformer模型,得到输出嵌入D;采用多个多层感知机(MLP)分支将D解码为五元组HOI实例,并预测人物之间的交互行为。本发明方法旨在解决现有技术人体姿态信息缺乏,人物交互动作识别精确度较低的问题。
技术关键词
人体姿态检测方法 骨骼关键点 融合特征 图片 姿态特征 记忆特征 交互动作识别 注意力 神经网络单元 图像 解码 编码器 人体关键点 通道 多层感知机 残差模块 感知系统 计算机视觉
系统为您推荐了相关专利信息
1
拼装积木模型的生成方法、装置、设备及存储介质
拼装积木 贴图 积木块 生成方法 矢量图
2
电子设备、车辆、方法及计算机程序产品
轨迹预测模型 障碍物 图片 电子设备 计算机程序产品
3
基于原型匹配的文本信息引导的自进化目标检测方法
原型 文本编码器 注意力机制 跨模态 图像编码器
4
多模态目标重识别学习方法、系统、装置以及可读介质
学习方法 多模态特征 视觉 全局平均池化 图像
5
一种基于电信规范多模态知识图谱的图检索增强生成方法
电信 多模态 三元组 生成方法 层级
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号