一种文本驱动三维人体动作生成方法

正文

推荐专利

一种文本驱动三维人体动作生成方法

申请号：CN202411881863

申请日期：2024-12-19

公开号：CN119810382B

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种文本驱动三维人体动作生成方法，通过扩散模型与大型语言模型实现细粒度人体动作生成。首先利用文本编码器提取文本的多层语义特征，同时使用大语言模型识别核心与非核心身体部位；然后将人体划分为左臂、右臂、左腿、右腿和躯干五个区域，通过多头交叉注意力机制对词级文本特征与各部位动作特征进行融合与细化；利用自适应损失函数优化核心部位动作，保持非核心部位自然流畅；最终通过扩散模型去噪生成全身运动。此外，该方法支持参数编辑与运动补全功能，能够灵活控制动作幅度和补全部分输入的动作。该方法可以应用于虚拟现实、动画制作和人机交互领域，生成的动作自然、精确且符合文本描述。

技术关键词

三维人体动作运动特征交叉注意力机制动作特征生成方法核心身体特征提取模块损失函数优化融合特征大语言模型集成层损失函数设计计算机设备文本编码器可读存储介质

系统为您推荐了相关专利信息

基于多源异构数据的医美内容AI生成方法及系统

脸部特征多源异构数据模板生成方法因子

一种智能化的体检数据整合建模系统

模糊推理模型中心化数据库数据存储模块建模系统身体健康状况

基于大语言模型的SQL生成方法及存储介质

大语言模型生成方法生成自然语言索引语义关键词

一种基于二次特征值提取的短期电力负荷预测方法

特征提取网络特征值卷积模型负荷特征负荷预测算法

面向科技文献问答系统的多类型问答数据链生成方法

面向科技文献问答系统生成方法答案生成机制

一种文本驱动三维人体动作生成方法

站点导航

APP 下载