摘要
本公开关于一种三维模型方法、装置、电子设备及存储介质,该方法包括:基于文本提示对应的参考图像和多个预设视角的视角信息的引导进行多视角图像生成处理,在多视角图像生成处理过程中,基于各预设视角的目标隐特征图生成体密度场和各预设视角的视角增强特征图,基于各视角增强特征图生成各预设视角的视角图像;基于文本提示和各预设视角的视角图像微调预训练图像去噪模型得到目标图像去噪模型;对基于体密度场生成的初始化三维模型的渲染图像添加噪声得到加噪渲染图像,将文本提示和加噪渲染图像输入至目标图像去噪模型进行噪声预测,基于噪声预测的结果调整初始化三维模型以得到目标三维模型。本公开提高了三维模型的收敛速度和质量。
技术关键词
三维模型生成方法
图像去噪模型
噪声预测
多视角
文本
三维模型生成装置
密度
三维模型方法
电子设备
超参数
图像生成单元
可读存储介质
微调单元
预训练模型
处理器
系统为您推荐了相关专利信息
文本检测模型
文本识别模型
卷积特征
识别方法
注意力机制
自然语言文本
知识提取方法
逻辑
大语言模型
医疗辅助系统
区域建议网络
标注方法
视觉特征
标注装置
多模态