摘要
本发明提供了一种基于扩散模型的零样本文本驱动视频编辑方法,属于视频编辑技术领域,包括:视频帧变换至潜在空间;帧间扩散特征的语义融合;自注意力引导;前景部分扩散。本发明通过视频帧变换至潜在空间;帧间扩散特征的语义融合;自注意力引导和前景部分扩散,不仅能够保持高保真度和一致性,还能在这些实例中准确呈现预期的编辑效果,并且减少了计算时间和计算量。
技术关键词
视频编辑方法
文本
视频帧
Softmax函数
视频编辑技术
样本
语义
噪声
注意力机制
轨迹
键值
模块
变量
像素
算法
网络
基础
系统为您推荐了相关专利信息
数据标注方法
异常信息
媒体资产管理
异常数据
时效性
综合管理装置
自然语言
多模态数据融合
图像多模态
模型剪枝
早产儿视网膜病变
识别系统
多模态
结构相似性算法
大语言模型
依存句法
交互注意力
情感分析方法
长短记忆网络
情感类别