一种基于文本驱动的数字人动作生成方法

AITNT
正文
推荐专利
一种基于文本驱动的数字人动作生成方法
申请号:CN202510137065
申请日期:2025-02-07
公开号:CN119579743B
公开日期:2025-04-15
类型:发明专利
摘要
本发明公开了一种基于文本驱动的数字人动作生成方法,在构建训练数据集时将人体各个身体部位进行解耦,针对每个身体部位生成对应的文本描述单元,通过随机选择文本描述单元构建描述同一动作的不同文本,缓解以往数据集存在的局部动作组合偏置的影响,帮助模型更好地将文本和其对应的局部身体动作进行关联;人体动作向量量化自编码器中的动作编码器和动作解码器均采用了图卷积网络的结构,更加有效地表征人体骨架连接关系。人体运动数据实际上应该为拓扑图结构,而非网格数据,因此图卷积神经网络相较于卷积神经网络,更有效地利用人体拓扑结构,提取关节之间地内在联系。模态转换模型受益于在训练时采用了局部语义强化的损失函数。
技术关键词
动作生成方法 人体关节点 文本 编码器 身体 动作特征 解码器 人体运动数据 节点特征 加权损失函数 生成数字人 输出特征 神经网络结构 表征人体 左手
系统为您推荐了相关专利信息
1
一种EtherCAT总线通信方法、存储介质、装置和从站板卡
总线通信方法 CPLD芯片 通信芯片 主控芯片 程序烧录接口
2
融合局部先验和多尺度全局背景的红外小目标检测方法
分支 解码器架构 解码模块 输出特征 多尺度
3
一种基于注意力增强残差UNet网络的CT图像处理方法
图像处理模型 图像处理方法 编码器特征 通道注意力机制 CT图像数据
4
一种基于Transformer的人体网格重建方法
网格重建方法 关节特征 姿态特征 编码器 人体
5
针对大语言模型转述攻击的基于句子语义的水印方法
大语言模型 水印方法 标记 词语 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号