一种视频生成方法

AITNT
正文
推荐专利
一种视频生成方法
申请号:CN202510513724
申请日期:2025-04-23
公开号:CN120166266A
公开日期:2025-06-17
类型:发明专利
摘要
本发明涉及一种视频生成方法,包括:S1、获取待生成视频的条件提示,并通过对齐模型对其内容提示进行重构,得到覆盖场景、动作与摄影机运动的条件内容提示,其中所述条件提示的内容包括文本、音频、图片或视频;S2、利用多模态编码器对所述内容提示进行编码,得到多模态向量嵌入;S3、调用经空间‑时间残差量化处理的视觉自动编码器,对训练集视频进行离线向量量化,获取视频token序列及其编码方式;S4、将视频token序列输入Mate模块,基于短程‑长程解耦空间‑时间注意力与滑动时间窗策略,输出与视频token的数量呈线性关系的表示;S5,将所述多模态向量嵌入与Mate模块输出进行交叉注意力融合,逐步采样得到目标视频token序列,并经解码器复原为完整视频。
技术关键词
视频生成方法 多模态 滑动时间窗 自动编码器 注意力 分支 序列 摄影机 解码器 训练集 文本 分辨率 策略 离线 模块 重构 运动 音频
系统为您推荐了相关专利信息
1
基于RGB图像与解剖约束的脊柱三维评估方法及系统
三维评估方法 智能移动设备 统计形状模型 深度图 椎体
2
一种基于模型注意力分散的三维对抗样本生成方法
样本生成方法 注意力 纹理 白盒 多策略融合
3
一种多模态知识追踪方法及系统
图谱 知识追踪方法 知识点 动态 跨模态
4
一种基于文本语义引导和自适应特征聚合的图文检索方法
图文检索方法 文本 图像块特征 细粒度特征 排序损失
5
基于双分支特征分解的跨模态图像差分融合方法及系统
融合方法 图像 融合特征 前馈神经网络 高频率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号