一种基于视觉Transformer的头部姿态估计方法

正文

推荐专利

申请号：CN202411566435

申请日期：2024-11-05

公开号：CN119445619B

公开日期：2025-11-18

类型：发明专利

摘要

本发明属于计算机视觉领域，具体涉及一种基于视觉Transformer的头部姿态估计方法，包括：构建头部姿态估计模型；获取待检测的图像，将图像输入到训练后的头部姿态估计模型中，得到头部姿态估计结果；所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块；本发明通过图像翻折操作引入翻折图像，能够为原图像提供自监督信息，通过这种方式，模型可以学习到姿态变化的反向特征，使得模型能够捕捉到不同姿态下的相似性，进一步提升头部姿态估计的准确度和稳定性。

技术关键词

头部姿态估计方法矩阵编码器模块多尺度网络模块融合特征注意力机制测地线距离前馈神经网络特征提取模块计算机视觉图像增强分支策略序列

系统为您推荐了相关专利信息

一种基于多层级特征融合与对比学习的多模态假新闻检测方法

假新闻检测方法多模态特征多层级特征文本视觉特征

一种基于三维高斯泼溅和深度相机的定位建图方法及系统

动态关键帧定位建图方法深度相机点云雅可比矩阵

一种露地瓜类的成熟度识别系统

识别系统图像处理模块深度学习训练图像采集模块掩膜矩阵

一种基于PID控制的电磁水表永磁励磁极化抑制系统

混合磁场电磁水表 PID控制器参数流量校准磁感应强度

一种基于自适应滤波的人形机器人上肢姿态估计方法

人形机器人上肢姿态估计方法关节点坐标系量测噪声

一种基于视觉Transformer的头部姿态估计方法

站点导航

APP 下载