摘要
本发明涉及基于分数蒸馏采样和三维高斯优化的文本引导人体生成方法,属于计算机视觉与图形图像领域。首先构建三维高斯人体表示,对输入的人体模板均匀实例化三维高斯,得到初始三维人体渲染图;再结合输入的文本描述对三维人体渲染图进行混合加噪,得到时间步长优化的含噪声潜在向量;然后,基于多时间步的含噪声潜在向量进行分数蒸馏采样,得到初始三维高斯人体;最后,对初始三维高斯人体进行三维高斯优化,输出最终三维人体模型。本发明能够有效生成具有纹理细节和与输入文本描述一致的三维人体,适用于虚拟人生成、数字内容制作等领域。
技术关键词
三维人体模型
噪声预测
生成方法
蒸馏
文本
深度图
透明度
因子
邻域
计算机视觉
参数
邻居
索引
模板
编码
定义
密度