一种视觉Transformer模型的压缩方法

正文

推荐专利

申请号：CN202510182409

申请日期：2025-02-19

公开号：CN120124699B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种视觉Transformer模型的压缩方法，根据实际需要在视觉Transformer模型Transformer Encoder的Transformer Block中确定待压缩block，将输入图像输入视觉Transformer模型的嵌入层生成图像嵌入后输入Transformer Encoder，当Transformer Block为待压缩block时，则计算补丁令牌的重要分数，根据重要分数对多头自注意力模块和叠加归一化模块处理后的补丁令牌进行采样和融合，得到补丁令牌压缩后的图像，然后输出至后续模块。本发明通过对Transformer Encoder的补丁令牌进行压缩，降低视觉Transformer模型计算复杂度、提升推理速度，同时保持模型的性能和通用性。

技术关键词

补丁令牌图像嵌入模型压缩方法队列视觉归一化模块注意力合并方法配额生成方法矩阵编码复杂度公差速度

系统为您推荐了相关专利信息

一种非标准道路场景的车道线虚拟方法、装置和电子设备

行驶车辆非标准车道线信息场景虚拟装置

网络设备的拥塞控制方法、装置、计算机设备及介质

网络状态信息节点网络设备度量瓶颈

一种UVM寄存器模型自动生成方法、系统、设备及介质

待测模块表格模型自动生成方法脚本参数

一种基于着色器追踪数据的缓存系统

子模块缓存系统令牌标志位软件

GCL门控时隙窗口自适应调整方法及系统

交换机混合流表达式网络节点数据

一种视觉Transformer模型的压缩方法

站点导航

APP 下载