摘要
本发明涉及Text‑3D生成领域,公开了一种基于扰动编码的复杂文本到3D模型的生成方法、系统、介质及设备,其包括:初始化网格神经辐射场,给定一个文本提示;随机采样视图角度,基于Grid的神经辐射场输出编码经扰动后,得到根据角度渲染扰动的图像z0;设置随机时间t,将图像z0加入随机噪声,得到图像zt;将图像zt、文本y和随机时间t输入图文大模型,根据SDS计算损失梯度,作为辐射场网络的损失;将计算一次损失梯度作为一个epoch,重复至设定次数,完成3D神经辐射场训练,输出网格神经辐射场模型,完成3D建模。本发明提升了算法的鲁棒性和计算效率,并显著改善了生成结果与复杂文本提示的一致性。
技术关键词
生成方法
文本
随机噪声
图像
网格
图文
程序
编码器
算法
生成系统
建模方法
编码模块
参数
网络
阶段
纹理
蒸馏
系统为您推荐了相关专利信息
变电站SSD文件
公用设备
二次设备建模
电力系统模型
生成方法
信息处理系统
对象
诊疗信息
风险预测模型
子模块
多层血管结构
实时监测方法
微循环
光声显微成像技术
实体