摘要
本发明公开了一种融合权重共享、剪枝与蒸馏的Swin Transformer模型压缩方法,涉及神经网络技术领域。所述方法包括如下步骤:在Swin Transformer模型的多层之间共享权重,在模型的层之间添加变换层实现权重变换;构建并分析变换块的参数依赖映射图,得到参数间的相互依赖性,并构建一个二进制分组矩阵F记录所有参数之间的依赖关系,通过深度优先搜索算法实现参数分组,属于同一组的参数会被同时移除;使用KL散度蒸馏方法对权重共享和结构化剪枝处理后的模型进行性能恢复。所述方法能够有效的降低模型的复杂程度,较好的平衡模型计算复杂度和性能之间的关系。
技术关键词
模型压缩方法
深度优先搜索算法
参数
注意力
矩阵
多层感知机
蒸馏方法
学生
教师
神经网络技术
关系
节点
模块
线性
平滑度
复杂度
决策
系统为您推荐了相关专利信息
管式反应器系统
补偿控制器
回流装置
切比雪夫
多项式
无人机控制方法
语义分割模型
RRT算法
避障路径
强化学习框架
高速公路服务区
物流
评价方法
评价指标体系
阶段