摘要
本申请公开了一种基于多视角的三维模型生成方法及系统。方法包含数据处理、模型训练和模型应用。数据处理包括对三维模型进行渲染,生成6个不同角度的RGB图片,并采用随机灯光变量以增加场景多样性,同时渲染对应的深度图和法线图。模型训练包括基于扩散模型架构,增加交叉注意力模块,训练分为两个阶段:第一阶段通过一张图片生成多视角图片;第二阶段利用多视角图片生成神经体渲染模型,重建三维模型。模型应用包括则以物体图片为条件,控制生成对应的三维模型。本申请能够自动调整物体结构,合理搭配场景,满足自动化搭建场景的需求,有效解决了传统三维建模中手动调整复杂、效率低下的问题,具有显著的创新性和实用性。
技术关键词
三维模型生成方法
图片
多视角
重建三维模型
随机噪声
深度图
相机外参
噪声系数
编码器
渲染系统
生成三维模型
多层感知机
更新网络参数
三维模型生成系统
模型训练模块
系统为您推荐了相关专利信息
快速识别方法
人体姿态估计
关键点
感知特征
图像生成模型
图片生成方法
规划
图片生成装置
绘图模型
电子设备
生成虚拟形象
视频生成方法
生成指令
生成程序
视频生成装置