用于多模态自回归视频模型的控制方法及系统

正文

推荐专利

申请号：CN202511165994

申请日期：2025-08-20

公开号：CN120916029A

公开日期：2025-11-07

类型：发明专利

摘要

本公开涉及一种用于多模态自回归视频模型的控制方法及系统。所述方法包括：基于用户设置，获取用户对于待生成视频按照时序划分的视频分段的时序规划参数、每个分段对应的预设状态参数以及所选用于每个分段的视频模态控制指令的参数；基于用户设置生成DSL脚本，并将该用户的DSL脚本编译成底层API请求，所述底层API请求包含用于自回归视频模型的底层视频控制信号；基于所述底层API请求，采用其中包含的底层控制信号，调用自回归视频模型；以及根据底层API请求中包含的底层视频控制信号，按照底层视频控制信号中的参数，自动调整所调用的自回归视频模型的各层的隐状态，以便使自回归视频模型按照预定的时序，基于调整后的预设状态和模态控制指令连续生成预定长度的视频。

技术关键词

视频多模态分段人体姿态控制脚本时序控制系统参数信号热力图深度图滤镜定义规划语义文本音频标记图像指令

用于多模态自回归视频模型的控制方法及系统

站点导航

APP 下载