摘要
本发明公开了一种视觉Transformer模型的压缩方法,根据实际需要在视觉Transformer模型Transformer Encoder的Transformer Block中确定待压缩block,将输入图像输入视觉Transformer模型的嵌入层生成图像嵌入后输入Transformer Encoder,当Transformer Block为待压缩block时,则计算补丁令牌的重要分数,根据重要分数对多头自注意力模块和叠加归一化模块处理后的补丁令牌进行采样和融合,得到补丁令牌压缩后的图像,然后输出至后续模块。本发明通过对Transformer Encoder的补丁令牌进行压缩,降低视觉Transformer模型计算复杂度、提升推理速度,同时保持模型的性能和通用性。
技术关键词
补丁
令牌
图像嵌入
模型压缩方法
队列
视觉
归一化模块
注意力
合并方法
配额
生成方法
矩阵
编码
复杂度
公差
速度