一种几何和姿态感知的文本生成三维对象方法及系统

AITNT
正文
推荐专利
一种几何和姿态感知的文本生成三维对象方法及系统
申请号:CN202510419997
申请日期:2025-04-03
公开号:CN120526036A
公开日期:2025-08-22
类型:发明专利
摘要
本发明公开了一种几何和姿态感知的文本生成三维对象方法及系统,包括以下步骤:将文本输入三维扩散生成模型获得粗糙三维对象,利用粗糙三维对象初创化目标三维对象;将目标三维对象通过渲染获得法向贴图;利用粗糙三维对象初创化目标三维对象,并将目标三维对象在的相机参数下渲染获得法向贴图,将法向贴图输入图片编码器得到图片特征向量;将输入文本与方位词合并在一起,通过文本编码器得到文本特征向量;将相机参数通过多层感知器编码得到相机特征;将图片特征向量、文本特征向量、相机特征输入到拓扑感知扩散模型中获得预测的高斯噪声计算分数蒸馏采样损失函数和低频法向平滑损失函数并进行梯度反传,迭代更新三维对象,获得最终三维对象。
技术关键词
生成三维对象 文本特征向量 法线贴图 相机 文本编码器 多层感知器 蒸馏 图片 神经网络架构 参数 高斯滤波器 预训练模型 噪声样本 模块 网络结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号