摘要
本发明公开了一种基于Swin‑Transformer架构的空频域压缩视频增强方法及装置,涉及图像处理领域,包括:提取目标帧及目标帧前后帧信息,使用卷积神经网络提取多帧特征信息并将其对齐并且融合成原始视频帧的残差图;使用Harr小波变换提取残差图宽、高各1/2尺寸的高频分量特征和低频分量特征;将提取到的低频分量特征使用基于Swin‑Transformer模块进行纹理和结构信息建模,对提取到的高频分量特征使用U‑net的方式进行特征重建;将重建后的高低频分量特征进行Haar小波反变换,并加入到原始视频帧中得到增强后的视频帧。本发明通过对残差图进行频域特征提取并重建,有效解决现阶段缺损压缩视频质量增强中存在对前后帧应用较少导致增强视频帧细节纹理表现不突出的问题,实现更好的增强效果。
技术关键词
分量特征
高频特征
水平高频分量
卷积神经网络提取
多通道特征
多层卷积神经网络
滤波模块
注意力机制
上采样
频域特征提取
序列
处理器
视频帧
特征提取模块
计算机程序产品