摘要
本申请公开了一种文本到三维的生成方法及装置、设备,该方法包括:对文本描述进行语义分析,得到文本嵌入;将文本嵌入输入到扩散模型中,输出与文本描述匹配的第一图像;将第一图像中建模对象的形状信息和纹理信息,以及视角信息输入到部件感知神经辐射场模型中,输出各个视角对应的第二图像,部件感知神经辐射场模型支持根据编辑信息对建模对象的部件进行编辑操作。如此,扩散模型提供2D图像作为先验参考,指导部件感知神经辐射场模型生成3D对象任何视角的渲染图像,提高生成3D对象的逼真度。并且在不影响其他部件的情况下,这些3D对象支持部件级形状和视觉属性的编辑操作,从而优化文本到三维的生成结果。
技术关键词
射线
结构网络
文本
纹理
编辑
多分辨率
视角
对象
采样点
生成方法
编码
噪声图像
网格
颜色
语义
矩阵
生成设备
系统为您推荐了相关专利信息
地理实体
地理数据系统
数据识别模型
自然语义
关系
液滴
分析方法
融合卷积神经网络
机器学习训练
核反应堆燃料棒