摘要
本发明公开了一种文本驱动三维人体动作生成方法,通过扩散模型与大型语言模型实现细粒度人体动作生成。首先利用文本编码器提取文本的多层语义特征,同时使用大语言模型识别核心与非核心身体部位;然后将人体划分为左臂、右臂、左腿、右腿和躯干五个区域,通过多头交叉注意力机制对词级文本特征与各部位动作特征进行融合与细化;利用自适应损失函数优化核心部位动作,保持非核心部位自然流畅;最终通过扩散模型去噪生成全身运动。此外,该方法支持参数编辑与运动补全功能,能够灵活控制动作幅度和补全部分输入的动作。该方法可以应用于虚拟现实、动画制作和人机交互领域,生成的动作自然、精确且符合文本描述。
技术关键词
三维人体动作
运动特征
交叉注意力机制
动作特征
生成方法
核心
身体
特征提取模块
损失函数优化
融合特征
大语言模型
集成层
损失函数设计
计算机设备
文本编码器
可读存储介质
系统为您推荐了相关专利信息
模糊推理模型
中心化数据库
数据存储模块
建模系统
身体健康状况
大语言模型
生成方法
生成自然语言
索引
语义关键词
特征提取网络
特征值
卷积模型
负荷特征
负荷预测算法