一种基于多令牌大语言模型的人体运动生成方法和系统

正文

推荐专利

申请号：CN202511094207

申请日期：2025-08-06

公开号：CN120597896B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及计算机软件技术领域，公开了一种基于多令牌大语言模型的人体运动生成方法和系统。所采用的人体动作生成模型的构建及训练过程包括将用户输入的文本描述映射为文本特征，并与任务提示词以及文本描述共同输入共享主干网络、多个颈部网络和预测头；将文本描述对应的人体动作编码为动作特征，通过对比学习拉近文本特征与动作特征的距离；将多个动作令牌通过动作解离散反编码技术生成人体动作；基于人类偏好进行基于动态边界的偏好对齐。本发明通过多令牌预测策略增强对稀疏动作令牌的建模能力，并引入跨模态特征指导实现全局语义对齐。同时，本发明提出带相似度偏移的人类偏好优化方法来提升生成动作与人类偏好的对齐程度。

技术关键词

生成动作动作特征大语言模型运动生成方法令牌运动生成系统文本编码器人体 Sigmoid函数网络语义数学编码技术中间层矩阵计算机软件技术人类分支

系统为您推荐了相关专利信息

一种基于人工智能技术的用户满意度分析方法及系统

满意度分析方法人工智能技术数据多模态语音编码器

一种面向林业垂直领域的语言大模型构造方法

模型构造方法图像编码多模态林业矩阵

语音同传方法、装置、介质及设备

语义音频大语言模型语音递归神经网络模型

基于智能体的语句转化方法、装置、电子设备及存储介质

语义向量语句大语言模型转化方法数据

推理系统的负载感知调度方法和推理系统

推理系统全局调度器多处理器动态更新阶段

一种基于多令牌大语言模型的人体运动生成方法和系统

站点导航

APP 下载