摘要
本申请涉及视频处理技术领域,提供了一种基于扩散模型的视频处理方法、设备及介质,该方法包括:获取扩散模型反向的时间步的目标视频的物理先验特征,并基于物理先验特征计算多头注意力模型的头部分配向量;对每一帧图像进行特征提取,得到局部特征,并进行聚合得到全局特征;基于头部分配向量对局部特征进行编码得到头部对应的局部编码向量,并对每个局部编码向量进行加权,得到最终局部编码向量,进行整合得到局部编码;对全局特征进行编码,并进行加权和整合得到全局编码;对全局编码和每个局部编码进行解码,得到去噪图像,并进行拼接得到去噪视频。本申请的方法能够提高扩散模型输出的视频的质量。
技术关键词
编码向量
注意力模型
视频
图像
物理
可读存储介质
矩阵
处理器
因子
终端设备
存储器
解码器
计算机
动态
系统为您推荐了相关专利信息
物体轮廓提取方法
轮廓模型
激光轮廓
激光扫描技术
尺寸误差
语义分割模型
图像特征向量
特征金字塔
语义特征
分支
绝缘子检测方法
解码器模型
计算机视觉
特征提取模型
图像增强模块
一体化机械臂
多自由度机械臂
焊接组件
加工件表面
切割组件
检测网络模型
频域特征
网络流量数据
多分支
融合特征