基于视觉语言模型的运动重定向方法

正文

推荐专利

基于视觉语言模型的运动重定向方法

申请号：CN202510963337

申请日期：2025-07-14

公开号：CN120894470A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了基于视觉语言模型的运动重定向方法，包括：步骤一：通过动作捕捉设备与多视角摄像头采集国标手语动作数据；步骤二：构建包含3D模型、模型对应的骨架结构、每帧动作数据序列、手语动作名称的自建数据集；步骤三：利用视觉语言模型提取手势视频的时序语义嵌入；步骤四：通过两阶段训练框架，先进行骨架感知预训练，再结合语义一致性损失与物理约束微调，生成目标角色的合规手语动作；本发明的有益效果是：两阶段重定向框架，确保目标动作关节位置与源动作一致，保证相邻帧动作平滑连贯，提升生成动作真实性，为后续动作细节优化奠定基础，实现高保真动作迁移。

技术关键词

运动重定向方法手语动作捕捉设备视觉语义生成动作两阶段序列物理时序关节动作特征数据框架手势合规性视角视频参数编码器

系统为您推荐了相关专利信息

文本动画视频生成方法、装置、电子设备及存储介质

文本语义标签动画视频生成方法层级序列

一种配电网高精度语义分割与动态隐患测距方法及系统

测距方法动作时序特征管控系统语义动态

基于多模态数据的医疗实验流程优化方法及系统

模态特征多模态融合特征数据跨模态

一种换电运维的数据处理方法、计算设备、可读存储介质

文本数据处理方法索引多轮对话可读存储介质

用于分析非结构化数据的方法、设备及存储介质

语义逻辑自然语言生成执行计划无依赖关系

基于视觉语言模型的运动重定向方法

站点导航

APP 下载