一种视频生成方法

正文

推荐专利

一种视频生成方法

申请号：CN202510513724

申请日期：2025-04-23

公开号：CN120166266A

公开日期：2025-06-17

类型：发明专利

摘要

本发明涉及一种视频生成方法，包括：S1、获取待生成视频的条件提示，并通过对齐模型对其内容提示进行重构，得到覆盖场景、动作与摄影机运动的条件内容提示，其中所述条件提示的内容包括文本、音频、图片或视频；S2、利用多模态编码器对所述内容提示进行编码，得到多模态向量嵌入；S3、调用经空间‑时间残差量化处理的视觉自动编码器，对训练集视频进行离线向量量化，获取视频token序列及其编码方式；S4、将视频token序列输入Mate模块，基于短程‑长程解耦空间‑时间注意力与滑动时间窗策略，输出与视频token的数量呈线性关系的表示；S5，将所述多模态向量嵌入与Mate模块输出进行交叉注意力融合，逐步采样得到目标视频token序列，并经解码器复原为完整视频。

技术关键词

视频生成方法多模态滑动时间窗自动编码器注意力分支序列摄影机解码器训练集文本分辨率策略离线模块重构运动音频

系统为您推荐了相关专利信息

基于RGB图像与解剖约束的脊柱三维评估方法及系统

三维评估方法智能移动设备统计形状模型深度图椎体

一种基于模型注意力分散的三维对抗样本生成方法

样本生成方法注意力纹理白盒多策略融合

一种多模态知识追踪方法及系统

图谱知识追踪方法知识点动态跨模态

一种基于文本语义引导和自适应特征聚合的图文检索方法

图文检索方法文本图像块特征细粒度特征排序损失

基于双分支特征分解的跨模态图像差分融合方法及系统

融合方法图像融合特征前馈神经网络高频率

一种视频生成方法

站点导航

APP 下载