摘要
一种针对视觉模块进行动态剪枝的参数高效微调方法,包括:在局部专家剪枝中,利用门控网络输出的门控值动态评估各专家网络重要性,通过预设阈值选择门控值相近且计算开销更小的专家进行实时替代,精准剪枝高复杂度模块;在全局模块剪枝中,通过计算各层MoE‑Conv模块的样本数量分布向量间的差异范数,识别冗余模块并动态跳过其计算,实现跨层计算优化。作为动态剪枝参数高效微调方法,通过局部专家剪枝和全局模块剪枝的双层优化机制,在保证模型性能的同时显著提升计算速度。不仅支持异构与同构专家网络架构,还通过冻结预训练参数、仅微调门控网络及剪枝超参数,实现了高效的计算与存储成本优化,兼顾视觉参数高效微调中计算开销与迁移性能。
技术关键词
动态剪枝
微调方法
混合专家网络
模块
冗余
视觉
超参数
网络架构
预训练模型
异构
计算机程序产品
样本
策略
可读存储介质
处理器
复杂度
系统为您推荐了相关专利信息
轨迹规划方法
冗余机械臂
三次样条函数
逆运动学
三次样条插值
生成方法
预训练模型
测试用例生成装置
车辆功能测试技术
图谱