摘要
本发明公开了一种多视图驱动三维生成方法,属于计算机视觉与三维重建领域。该方法通过对物体的多视图像进行编码生成对应的特征表示,为后续的校正流引导三维模型优化提供支持;采用校正流模型在物体的多视角下图像的条件引导下将先验分布下的三维样本逐步转换为物体的隐式三维表示,并采用多视图Transformer网络作为校正流模型的速度预测模型,校正流模型从高斯分布样本开始,依据当前状态和速度场引导,持续修正样本路径,使样本沿着预定轨迹稳定接近目标分布,达成物体隐式表述的高效重塑,最后通过解码器将该隐式表述解码为三维高斯点云,从而实现对物体的三维重建。该方法具有速度快、重建质量高的优点,适用于三维建模与数据仿真等领域。
技术关键词
三维生成方法
注意力
图像
可读存储介质
编码向量
前馈神经网络
样本
多视角
解码器
速度预测模型
物体
计算机
点云
三维模型
校正
矩阵
元素
指令