一种基于局部风格编码器的语音驱动三维人体运动方法

AITNT
正文
推荐专利
一种基于局部风格编码器的语音驱动三维人体运动方法
申请号:CN202511414903
申请日期:2025-09-30
公开号:CN120894473A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种基于局部风格编码器的语音驱动三维人体运动方法,涉及一般的图像数据处理或产生,包括语音驱动风格化三维人体运动整体模型构建步骤和具有参考风格的三维人体运动网络输出步骤,语音驱动风格化三维人体运动整体模型通过局部风格编码器提取局部感知风格特征,并从语音中提取语义、韵律和情感特征。将这些多种条件注入到部分感知扩散模型中,通过参考运动风格和语音信息,合成具有参考风格的三维人体运动。本发明能够合成具有参考风格的三维人体运动,显著提升生成的三维运动序列的自然性和表现力。
技术关键词
三维人体运动 运动特征 风格 情感特征 韵律特征 语义特征 运动编码器 样本 序列 梯度下降法 图像数据处理 网格 注意力 语音编码 网络 表达式
系统为您推荐了相关专利信息
1
人形机器人和具身智能机器人的行为安全控制方法
安全控制方法 人形机器人 动态障碍物 智能机器人 生成环境地图
2
一种动漫图像线稿提取方法、系统、设备及存储介质
动漫图像 注意力 风格 层级 语义
3
虚拟环境数据处理方法、电子设备及存储介质
数据处理方法 场景 视觉 问答模型 摘要
4
车辆巡航控制方法、装置、设备、存储介质及程序产品
车辆巡航控制方法 历史运行数据 车辆状态信息 附件 风格
5
图像生成方法、电子设备、存储介质和程序产品
图像生成模型 图像生成方法 对象 纹理特征 适配器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号