基于视觉语言模型的运动重定向方法

AITNT
正文
推荐专利
基于视觉语言模型的运动重定向方法
申请号:CN202510963337
申请日期:2025-07-14
公开号:CN120894470A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了基于视觉语言模型的运动重定向方法,包括:步骤一:通过动作捕捉设备与多视角摄像头采集国标手语动作数据;步骤二:构建包含3D模型、模型对应的骨架结构、每帧动作数据序列、手语动作名称的自建数据集;步骤三:利用视觉语言模型提取手势视频的时序语义嵌入;步骤四:通过两阶段训练框架,先进行骨架感知预训练,再结合语义一致性损失与物理约束微调,生成目标角色的合规手语动作;本发明的有益效果是:两阶段重定向框架,确保目标动作关节位置与源动作一致,保证相邻帧动作平滑连贯,提升生成动作真实性,为后续动作细节优化奠定基础,实现高保真动作迁移。
技术关键词
运动重定向方法 手语 动作捕捉设备 视觉 语义 生成动作 两阶段 序列 物理 时序 关节 动作特征 数据 框架 手势 合规性 视角 视频 参数 编码器
系统为您推荐了相关专利信息
1
文本动画视频生成方法、装置、电子设备及存储介质
文本 语义标签 动画视频生成方法 层级 序列
2
一种配电网高精度语义分割与动态隐患测距方法及系统
测距方法 动作时序特征 管控系统 语义 动态
3
基于多模态数据的医疗实验流程优化方法及系统
模态特征 多模态 融合特征 数据 跨模态
4
一种换电运维的数据处理方法、计算设备、可读存储介质
文本 数据处理方法 索引 多轮对话 可读存储介质
5
用于分析非结构化数据的方法、设备及存储介质
语义 逻辑 自然语言 生成执行计划 无依赖关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号