一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法

正文

推荐专利

申请号：CN202510102238

申请日期：2025-01-22

公开号：CN119946271A

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法，包括：将待压缩图像输入训练好的图像压缩模型中输出重建图像；模型的训练步骤包括：对输入的原始图像x经卷积变换后生成的若干个通道特征进行特征提取并自适应地关注对压缩任务重要的通道特征，生成潜在表示y；获潜在表示y之间的冗余信息，计算高斯分布(μ,σ)；使用高斯概率模型结合高斯分布对潜在表示y进行建模，生成潜在表示对潜在表示进行解码重建生成重建图像；基于重建图像和原始图像之间的差值以及压缩原始图像产生的码流比特数计算损失函数并反向优化模型参数；迭代训练直至模型收敛或达到最大迭代次数。本发明能够提高模型的压缩性能并显著降低模型的复杂度。

技术关键词

图像压缩方法注意力多层感知机模块输出特征高斯概率模型主编码器切片解码器比特数支路通道参数网络冗余复杂度

系统为您推荐了相关专利信息

一种冷藏集装箱监测方法、装置、设备及存储介质

冷藏集装箱主节点电力载波信道监测方法数据

融合光学和雷达遥感的输电通道隐患识别方法及系统

特征提取模型混合损失函数雷达遥感数据识别方法光学遥感数据

演示文稿生成方法、装置、电子设备

演示文稿生成方法文本层级生成装置电子设备

电火花放电加工工时的预测方法、装置、设备及介质

放电特征工件放电电极仿真模型实心

一种融合语义增强的跨语言翻译方法

子模块语言翻译方法存储模块融合语义多语言

一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法

站点导航

APP 下载