基于Swin-Transformer架构的空频域压缩视频增强方法及装置

正文

推荐专利

申请号：CN202510613168

申请日期：2025-05-13

公开号：CN120147166B

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于Swin‑Transformer架构的空频域压缩视频增强方法及装置，涉及图像处理领域，包括：提取目标帧及目标帧前后帧信息，使用卷积神经网络提取多帧特征信息并将其对齐并且融合成原始视频帧的残差图；使用Harr小波变换提取残差图宽、高各1/2尺寸的高频分量特征和低频分量特征；将提取到的低频分量特征使用基于Swin‑Transformer模块进行纹理和结构信息建模，对提取到的高频分量特征使用U‑net的方式进行特征重建；将重建后的高低频分量特征进行Haar小波反变换，并加入到原始视频帧中得到增强后的视频帧。本发明通过对残差图进行频域特征提取并重建，有效解决现阶段缺损压缩视频质量增强中存在对前后帧应用较少导致增强视频帧细节纹理表现不突出的问题，实现更好的增强效果。

技术关键词

分量特征高频特征水平高频分量卷积神经网络提取多通道特征多层卷积神经网络滤波模块注意力机制上采样频域特征提取序列处理器视频帧特征提取模块计算机程序产品

基于Swin-Transformer架构的空频域压缩视频增强方法及装置

站点导航

APP 下载