摘要
本说明书实施例公开了一种基于深度估计的单目物体三维重建方法及装置,包括:获取待处理的多视角图像;基于图像分割模型,对所述待处理的多视角图像进行分割,获取多视角场景线索以及多视角物体图像;基于所述多视角物体图像,通过预设的视觉大模型组合获取一致性特征,以及基于所述多视角场景线索,通过预设的Transformer模型获取解构特征;所述一致性特征与所述解构特征,通过扩散Unet模型进行融合重建,获得超分隐编码;基于所述多视角场景线索以及所述超分隐编码进行多层次深度预测,获得深度信息;基于所述深度信息进行三维重建,生成单目目标图像。
技术关键词
多视角
物体三维重建方法
线索
场景
编码
图像分割模型
视觉
解码器
注意力机制
正则化参数
结构特征提取
多层次
语义特征
纹理特征提取
系统为您推荐了相关专利信息
数据去噪方法
无监督学习
编码器
雷达
训练深度学习模型
物体位置数据
位置控制方法
文本
位置坐标参数
图像生成器