摘要
本申请实施例提供三维场景中图像生成方法、装置、设备和存储介质,涉及图像处理技术领域。该方法将获取的视图角度输入网格神经辐射场进行图像渲染生成初始图像,根据时间步长为初始图像添加噪声得到噪声图像,将文本提示信息、噪声图像和时间步长输入图文大模型进行图像生成,得到第一梯度以及与第二梯度,根据第一梯度和第二梯度生成对应于网格神经辐射场的损失值,基于损失值对网格神经辐射场进行模型调整。利用文本提示信息提供语义引导生成过程朝着与文本提示信息相关的方向优化,减少随机噪声的干扰,利用噪声图像提供几何约束确保生成结果在几何上与目标的场景一致,提升生成准确率。另外避免复杂的分数函数映射过程,提升优化效率。
技术关键词
噪声图像
图像生成方法
文本
度量
网格
图文
协方差矩阵
场景
视角
因子
生成特征
随机噪声
图像生成装置
参数
图像处理技术
开方
电子设备
数据
系统为您推荐了相关专利信息
合成孔径雷达卫星
网格
雷达回波数据
计算机可存储介质
信息数据处理终端
芯片封装方法
芯片封装结构
玻璃
金属线
网格状结构