摘要
本发明公开了一种基于强化学习的人工智能模型的多分解压缩方法,属于神经网络模型压缩技术领域。本方法构建了基于强化学习的多分解方法联合应用框架,针对模型的各个网络层自动选择最优的分解方法,并同步确定其对应的最优秩r;模型训练过程中采用联合优化目标函数,综合考虑模型的精度与压缩成本,并通过交替优化求解,有效平衡压缩率与模型准确性的关系,从而实现最优的模型压缩效果。本方法的核心在于为神经网络模型的各网络层选择最适宜的分解策略,最大化低秩分解的整体压缩效果;更重要的是,经过低秩分解压缩后的模型可直接部署,无需额外的重新训练或精度调整,从而提高模型的实用性与部署效率。
技术关键词
低秩分解方法
人工智能模型
预训练模型
训练神经网络模型
矩阵
参数更新模块
模型压缩
精度
框架
策略
关系
核心
数值
误差