一种基于扩散模型的零样本文本驱动视频编辑方法

AITNT
正文
推荐专利
一种基于扩散模型的零样本文本驱动视频编辑方法
申请号:CN202510232326
申请日期:2025-02-28
公开号:CN120091182A
公开日期:2025-06-03
类型:发明专利
摘要
本发明提供了一种基于扩散模型的零样本文本驱动视频编辑方法,属于视频编辑技术领域,包括:视频帧变换至潜在空间;帧间扩散特征的语义融合;自注意力引导;前景部分扩散。本发明通过视频帧变换至潜在空间;帧间扩散特征的语义融合;自注意力引导和前景部分扩散,不仅能够保持高保真度和一致性,还能在这些实例中准确呈现预期的编辑效果,并且减少了计算时间和计算量。
技术关键词
视频编辑方法 文本 视频帧 Softmax函数 视频编辑技术 样本 语义 噪声 注意力机制 轨迹 键值 模块 变量 像素 算法 网络 基础
系统为您推荐了相关专利信息
1
一种基于大模型的多维度媒体资产数据标注方法
数据标注方法 异常信息 媒体资产管理 异常数据 时效性
2
一种基于扩散模型的自监督学习多模态推荐方法及系统
模态特征 推荐方法 多模态 生成用户 语义
3
一种自然语言处理技术综合管理装置及其使用方法
综合管理装置 自然语言 多模态数据融合 图像多模态 模型剪枝
4
一种基于多模态大模型的早产儿视网膜病变识别系统
早产儿视网膜病变 识别系统 多模态 结构相似性算法 大语言模型
5
一种基于依赖增强的异构图卷积网络的情感分析方法
依存句法 交互注意力 情感分析方法 长短记忆网络 情感类别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号