一种基于文本引导的三维可驱动人体生成与编辑方法

AITNT
正文
推荐专利
一种基于文本引导的三维可驱动人体生成与编辑方法
申请号:CN202511017112
申请日期:2025-07-23
公开号:CN120912769A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供了一种基于文本引导的三维可驱动人体生成与编辑方法,包括:步骤1,通过使用大语言模型,对多视图人体数据集进行标注;步骤2,构建UV对齐的3D高斯数字人表征方式;步骤3,构建结构化隐空间并训练小型自解码器;步骤4,实现文本引导的结构化隐空间生成;步骤5,对已经生成的3D高斯数字人对应的隐空间特征进行重绘制,得到新文本描述对应的隐空间特征,通过训练好的小型自解码器将新文本描述对应的隐空间特征解码为新文本描述对应的3D高斯数字人,实现对3D高斯数字人的编辑。本发明提出了一个新颖的框架来拟合结构化三维人体数据的分布,并实现文本引导的三维人体生成与编辑。
技术关键词
人体模型 编码解码器 蒙皮 文本编码器 大语言模型 纹理 编辑方法 噪声样本 生成预测图像 网格 透明度 分类器 线性
系统为您推荐了相关专利信息
1
对象分析方法、装置、计算机设备、可读存储介质和程序产品
大语言模型 样本 对象分析方法 文本 信息发布平台
2
一种数据处理方法、装置、电子设备及存储介质
文本 标记 数据处理方法 大语言模型 数据处理装置
3
面向车联网的海量多模数据检索方法
数据检索方法 面向车联网 压缩特征 查询特征 PCA算法
4
车辆周围环境分析方法、装置、设备及介质
图片 车辆周围环境 物体 视频段 实例分割模型
5
基于大语言模型检索增强的实体标准化方法及模型
实体 大语言模型 标准化方法 键值对数据库 生成答案
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号