一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法

AITNT
正文
推荐专利
一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法
申请号:CN202510102238
申请日期:2025-01-22
公开号:CN119946271A
公开日期:2025-05-06
类型:发明专利
摘要
本发明公开了一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法,包括:将待压缩图像输入训练好的图像压缩模型中输出重建图像;模型的训练步骤包括:对输入的原始图像x经卷积变换后生成的若干个通道特征进行特征提取并自适应地关注对压缩任务重要的通道特征,生成潜在表示y;获潜在表示y之间的冗余信息,计算高斯分布(μ,σ);使用高斯概率模型结合高斯分布对潜在表示y进行建模,生成潜在表示对潜在表示进行解码重建生成重建图像;基于重建图像和原始图像之间的差值以及压缩原始图像产生的码流比特数计算损失函数并反向优化模型参数;迭代训练直至模型收敛或达到最大迭代次数。本发明能够提高模型的压缩性能并显著降低模型的复杂度。
技术关键词
图像压缩方法 注意力 多层感知机 模块 输出特征 高斯概率模型 主编码器 切片 解码器 比特数 支路 通道 参数 网络 冗余 复杂度
系统为您推荐了相关专利信息
1
一种冷藏集装箱监测方法、装置、设备及存储介质
冷藏集装箱 主节点 电力载波信道 监测方法 数据
2
融合光学和雷达遥感的输电通道隐患识别方法及系统
特征提取模型 混合损失函数 雷达遥感数据 识别方法 光学遥感数据
3
演示文稿生成方法、装置、电子设备
演示文稿生成方法 文本 层级 生成装置 电子设备
4
电火花放电加工工时的预测方法、装置、设备及介质
放电特征 工件 放电电极 仿真模型 实心
5
一种融合语义增强的跨语言翻译方法
子模块 语言翻译方法 存储模块 融合语义 多语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号