摘要
本申请公开了一种文本到三维的生成方法、装置及设备,能够提高由文本生成三维对象的可信度。该方法包括:对文本描述进行语义分析,得到文本嵌入;基于文本嵌入,确定待建模对象对应的初始神经辐射场模型;通过二维指导模型与三维指导模型,对初始神经辐射场模型进行更新,确定待建模对象对应的神经辐射场模型;对神经辐射场模型进行多视角渲染,确定待建模对象对应的三维对象。
技术关键词
噪声预测
文本
多视角
生成方法
语义
生成三维对象
二维图像数据
三维图像数据
多分辨率
计算机程序产品
相机
网格
图像分析
生成装置
样本
可读存储介质
指令
系统为您推荐了相关专利信息
视频流管理
大语言模型
多模态
智能管理系统
图像
视角
视觉特征提取
跨模态
文本编码器
视频编码器