摘要
本发明提供了一种基于文本引导的三维可驱动人体生成与编辑方法,包括:步骤1,通过使用大语言模型,对多视图人体数据集进行标注;步骤2,构建UV对齐的3D高斯数字人表征方式;步骤3,构建结构化隐空间并训练小型自解码器;步骤4,实现文本引导的结构化隐空间生成;步骤5,对已经生成的3D高斯数字人对应的隐空间特征进行重绘制,得到新文本描述对应的隐空间特征,通过训练好的小型自解码器将新文本描述对应的隐空间特征解码为新文本描述对应的3D高斯数字人,实现对3D高斯数字人的编辑。本发明提出了一个新颖的框架来拟合结构化三维人体数据的分布,并实现文本引导的三维人体生成与编辑。
技术关键词
人体模型
编码解码器
蒙皮
文本编码器
大语言模型
纹理
编辑方法
噪声样本
生成预测图像
网格
透明度
分类器
线性
系统为您推荐了相关专利信息
大语言模型
样本
对象分析方法
文本
信息发布平台
文本
标记
数据处理方法
大语言模型
数据处理装置
数据检索方法
面向车联网
压缩特征
查询特征
PCA算法
实体
大语言模型
标准化方法
键值对数据库
生成答案