一种基于文本引导的三维可驱动人体生成与编辑方法

正文

推荐专利

申请号：CN202511017112

申请日期：2025-07-23

公开号：CN120912769A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供了一种基于文本引导的三维可驱动人体生成与编辑方法，包括：步骤1，通过使用大语言模型，对多视图人体数据集进行标注；步骤2，构建UV对齐的3D高斯数字人表征方式；步骤3，构建结构化隐空间并训练小型自解码器；步骤4，实现文本引导的结构化隐空间生成；步骤5，对已经生成的3D高斯数字人对应的隐空间特征进行重绘制，得到新文本描述对应的隐空间特征，通过训练好的小型自解码器将新文本描述对应的隐空间特征解码为新文本描述对应的3D高斯数字人，实现对3D高斯数字人的编辑。本发明提出了一个新颖的框架来拟合结构化三维人体数据的分布，并实现文本引导的三维人体生成与编辑。

技术关键词

人体模型编码解码器蒙皮文本编码器大语言模型纹理编辑方法噪声样本生成预测图像网格透明度分类器线性

系统为您推荐了相关专利信息

对象分析方法、装置、计算机设备、可读存储介质和程序产品

大语言模型样本对象分析方法文本信息发布平台

一种数据处理方法、装置、电子设备及存储介质

文本标记数据处理方法大语言模型数据处理装置

面向车联网的海量多模数据检索方法

数据检索方法面向车联网压缩特征查询特征 PCA算法

车辆周围环境分析方法、装置、设备及介质

图片车辆周围环境物体视频段实例分割模型

基于大语言模型检索增强的实体标准化方法及模型

实体大语言模型标准化方法键值对数据库生成答案

一种基于文本引导的三维可驱动人体生成与编辑方法

站点导航

APP 下载