摘要
本发明公开一种基于深度估计和扩散模型的新视角图像生成的方法。本发明首先生成训练数据集,并利用其预训练图像内容填充模型和深度补全模型;利用单目深度估计模型估计输入图像的单目深度,构建其网格表示,并渲染新视角带有掩码的图像和深度;利用预训练的图像内容填充模型和深度补全模型,填充新视角带有掩码的图像和深度中的掩码内容。通过结合深度估计和扩散模型,本发明方法能更准确地估计深度,从而在生成新视角图像时提供更高的3D结构质量和细节。本发明方法能够处理更广泛的视角变换,突破了现有技术只能处理有限小视角变换的限制。
技术关键词
单目深度估计
生成训练数据
网格模型
深度图
视角
三维渲染技术
图像生成系统
模型预训练
坐标
标识
像素
场景
相机
文本
纹理
运动
模块
标签
系统为您推荐了相关专利信息
地图构建方法
视觉位姿估计
运动估计
优化地图数据
深度图像数据
不确定性特征
脑肿瘤分割
特征提取模块
冠状
医学图像分析技术
语义特征
渲染方法
计算机可执行指令
深度图
图像
有限元网格模型
CATIA软件
数据
分区
关键字
决策
数据采集模块
生物标志物数据
非线性动力学
医学影像数据