摘要
本发明属于计算机视觉领域,具体涉及一种基于视觉Transformer的头部姿态估计方法,包括:构建头部姿态估计模型;获取待检测的图像,将图像输入到训练后的头部姿态估计模型中,得到头部姿态估计结果;所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块;本发明通过图像翻折操作引入翻折图像,能够为原图像提供自监督信息,通过这种方式,模型可以学习到姿态变化的反向特征,使得模型能够捕捉到不同姿态下的相似性,进一步提升头部姿态估计的准确度和稳定性。
技术关键词
头部姿态估计方法
矩阵
编码器模块
多尺度
网络模块
融合特征
注意力机制
测地线距离
前馈神经网络
特征提取模块
计算机视觉
图像增强
分支
策略
序列
系统为您推荐了相关专利信息
假新闻检测方法
多模态特征
多层级特征
文本
视觉特征
动态关键帧
定位建图方法
深度相机
点云
雅可比矩阵
识别系统
图像处理模块
深度学习训练
图像采集模块
掩膜矩阵
混合磁场
电磁水表
PID控制器参数
流量校准
磁感应强度
人形机器人上肢
姿态估计方法
关节点
坐标系
量测噪声