一种基于光流信息的扩散模型视频生成方法

AITNT
正文
推荐专利
一种基于光流信息的扩散模型视频生成方法
申请号:CN202411503462
申请日期:2024-10-25
公开号:CN119762632B
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种基于光流信息的扩散模型视频生成方法。首先对现有数据集中的视频进行预处理,获取参考图像信息和光流信息;然后使用标准Stable Diffusion模型作为视频生成的主干网络;使用两个与标准SD模型中Unet结构相同的Unet分别提取参考图像特征和光流特征,参考图像特征在自注意力层与SD模型Unet的自注意力层进行融合,光流特征在交叉注意力层和SD模型Unet的时序注意力层进行融合。同时为了更好的利用光流信息,本发明提出了运动损失来进一步提高网络的生成效果。另外,本发明也采用了多样化的提示信息使得网络能够获得更加稳定的生成效果。
技术关键词
注意力 视频生成方法 时序 光流特征 噪声 网络 图像 图片 编码器 输出特征 光流算法 运动 代表 序列 解码器 参数 通道 矩阵 分辨率
系统为您推荐了相关专利信息
1
基于端到端自动驾驶大模型的驾驶行为标注方法及装置
编码向量 标注方法 多视角 文本 行车轨迹预测
2
基于性能感知的全局通道剪枝与YOLOv5结合的龋齿检测方法
通道剪枝 深度神经网络模型 输出特征 参数 数据
3
多模态大模型辅助下噪声鲁棒的人体骨架无监督表示学习方法及装置
人体骨架序列 学习方法 无监督 信息熵 多模态
4
一种提升SPI通信波特率的电路架构及实现方法
时钟 波特率 数据选择器 电路架构 主机
5
基于多模态体素图像特征融合注意力的三维目标检测方法
模态特征 注意力 网格特征 图像 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号