一种文本驱动三维人体动作生成方法

AITNT
正文
推荐专利
一种文本驱动三维人体动作生成方法
申请号:CN202411881863
申请日期:2024-12-19
公开号:CN119810382B
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种文本驱动三维人体动作生成方法,通过扩散模型与大型语言模型实现细粒度人体动作生成。首先利用文本编码器提取文本的多层语义特征,同时使用大语言模型识别核心与非核心身体部位;然后将人体划分为左臂、右臂、左腿、右腿和躯干五个区域,通过多头交叉注意力机制对词级文本特征与各部位动作特征进行融合与细化;利用自适应损失函数优化核心部位动作,保持非核心部位自然流畅;最终通过扩散模型去噪生成全身运动。此外,该方法支持参数编辑与运动补全功能,能够灵活控制动作幅度和补全部分输入的动作。该方法可以应用于虚拟现实、动画制作和人机交互领域,生成的动作自然、精确且符合文本描述。
技术关键词
三维人体动作 运动特征 交叉注意力机制 动作特征 生成方法 核心 身体 特征提取模块 损失函数优化 融合特征 大语言模型 集成层 损失函数设计 计算机设备 文本编码器 可读存储介质
系统为您推荐了相关专利信息
1
基于多源异构数据的医美内容AI生成方法及系统
脸部特征 多源异构数据 模板 生成方法 因子
2
一种智能化的体检数据整合建模系统
模糊推理模型 中心化数据库 数据存储模块 建模系统 身体健康状况
3
基于大语言模型的SQL生成方法及存储介质
大语言模型 生成方法 生成自然语言 索引 语义关键词
4
一种基于二次特征值提取的短期电力负荷预测方法
特征提取网络 特征值 卷积模型 负荷特征 负荷预测算法
5
面向科技文献问答系统的多类型问答数据链生成方法
面向科技文献 问答系统 生成方法 答案 生成机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号