摘要
本发明公开了一种基于Transformer的人体网格重建方法,该方法首先获取公开的人体数据集,并对人体数据集中图像进行标准化。其次人体数据集中图像,分别通过前视图编码器和视角转换网络两个支路生成多个视角特征,并分别进行优化与增强,融合优化与增强后的特征,生成多视角聚合特征。然后结合Transformer编码器优化,从人体数据集中图像中提取初始关节特征,生成最终的姿态特征。最后构建网格回归模块,将多视角聚合特征与姿态特征相加,并输入到网格回归模块,生成最终的人体网格重建结果。本发明通过融合不同视角的特征信息,在复杂姿势变化和遮挡情况下有效提升人体网格重建的精度和细节表现。
技术关键词
网格重建方法
关节特征
姿态特征
编码器
人体
上下文语义信息
交叉注意力机制
顶点
分支
感知特征
掩码矩阵
多视角
解码器
模块
图像
空间结构
系统为您推荐了相关专利信息
复合故障识别方法
异常数据
样本
编码器
重构误差
三维人体姿态估计
估计方法
融合特征
多层感知器
视频
智能产线
称重检测机构
定量装罐装置
传送带
限位机构
意图指令
机器视觉方法
数据
文本编码器
视觉算法
局部放电识别方法
局部放电识别系统
编码技术
变压器
图谱特征