摘要
本公开涉及一种用于多模态自回归视频模型的控制方法及系统。所述方法包括:基于用户设置,获取用户对于待生成视频按照时序划分的视频分段的时序规划参数、每个分段对应的预设状态参数以及所选用于每个分段的视频模态控制指令的参数;基于用户设置生成DSL脚本,并将该用户的DSL脚本编译成底层API请求,所述底层API请求包含用于自回归视频模型的底层视频控制信号;基于所述底层API请求,采用其中包含的底层控制信号,调用自回归视频模型;以及根据底层API请求中包含的底层视频控制信号,按照底层视频控制信号中的参数,自动调整所调用的自回归视频模型的各层的隐状态,以便使自回归视频模型按照预定的时序,基于调整后的预设状态和模态控制指令连续生成预定长度的视频。
技术关键词
视频
多模态
分段
人体姿态控制
脚本
时序
控制系统
参数
信号
热力图
深度图
滤镜
定义
规划
语义
文本
音频
标记
图像
指令