一种基于扩散模型的零样本文本驱动视频编辑方法

正文

推荐专利

申请号：CN202510232326

申请日期：2025-02-28

公开号：CN120091182A

公开日期：2025-06-03

类型：发明专利

摘要

本发明提供了一种基于扩散模型的零样本文本驱动视频编辑方法，属于视频编辑技术领域，包括：视频帧变换至潜在空间；帧间扩散特征的语义融合；自注意力引导；前景部分扩散。本发明通过视频帧变换至潜在空间；帧间扩散特征的语义融合；自注意力引导和前景部分扩散，不仅能够保持高保真度和一致性，还能在这些实例中准确呈现预期的编辑效果，并且减少了计算时间和计算量。

技术关键词

视频编辑方法文本视频帧 Softmax函数视频编辑技术样本语义噪声注意力机制轨迹键值模块变量像素算法网络基础

系统为您推荐了相关专利信息

一种基于大模型的多维度媒体资产数据标注方法

数据标注方法异常信息媒体资产管理异常数据时效性

一种基于扩散模型的自监督学习多模态推荐方法及系统

模态特征推荐方法多模态生成用户语义

一种自然语言处理技术综合管理装置及其使用方法

综合管理装置自然语言多模态数据融合图像多模态模型剪枝

一种基于多模态大模型的早产儿视网膜病变识别系统

早产儿视网膜病变识别系统多模态结构相似性算法大语言模型

一种基于依赖增强的异构图卷积网络的情感分析方法

依存句法交互注意力情感分析方法长短记忆网络情感类别

一种基于扩散模型的零样本文本驱动视频编辑方法

站点导航

APP 下载