一种基于多模态三维特征融合的凝视估计方法

正文

推荐专利

申请号：CN202511097295

申请日期：2025-08-06

公开号：CN121011013A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于多模态三维特征融合的凝视估计方法。该方法首先从RGB图像与深度图像中提取人体三维姿态特征、视图方向先验以及场景物体三维位置特征等多模态三维特征；然后将所述提取的三维特征从相机坐标系转换至以头部为原点的自我中心空间；接着，对变换后的三维特征进行方向和距离分离编码；最后，通过Transformer网络对所述编码后的人体与物体的三维特征进行交互建模，从而预测出最终的三维凝视方向。本发明通过融合多模态三维信息并进行归一化交互建模，有效克服了传统方法对清晰、近距离面部图像的依赖，显著提升了在距离远、存在遮挡等无约束场景下三维凝视估计的鲁棒性与准确性。

技术关键词

估计方法人体三维姿态多模态物体轻量级卷积神经网络关键点三维人体姿态估计正弦编码坐标系三维特征提取相机无约束场景姿态归一化交叉注意力机制实例分割模型图像矩阵

系统为您推荐了相关专利信息

一种基于多模态分解重构的电力系统净负荷预测方法

净负荷预测方法混合神经网络模型电力系统多模态发电量

一种基于深度学习的多模态图像配准模型及方法

图像配准模型特征提取模块图像配准方法解码器结构编码器

一种基于多模态的网络教学数据分析方法及系统

教学数据分析节点多模态特征融合学习终端表达式

一种基于骨度分寸的穴位识别方法及系统

穴位识别方法多模态数据采集生物电阻抗深度学习模型坐标系

基于物联网大模型的泥石流应急监管系统、方法和介质

多模态风险评估模型植被数据控制平台

一种基于多模态三维特征融合的凝视估计方法

站点导航

APP 下载