用于端侧模型训练加速的大模型剪枝方法、装置和设备

正文

推荐专利

申请号：CN202411894221

申请日期：2024-12-20

公开号：CN119740624A

公开日期：2025-04-01

类型：发明专利

摘要

本申请涉及一种用于端侧模型训练加速的大模型剪枝方法、装置和设备，所述方法指出端侧模型训练的主要瓶颈在于对输入序列的all‑to‑all注意力运算。all‑to‑all运算构造了一个完全图，即每个序列的token都和其余所有token建立了有向边，这种完全图是稠密结构，但是不同的token间有差异化的相似性，本方法根据token序列的差异化相似性构造系列化的稀疏图，实现了系列化、通用化的Transformer稀疏剪枝，为Transformer模型训练师提供了一套灵活的稀疏剪枝工具，通过剪除模型中不重要的参数，减少模型的计算量和存储需求，从而在有限的资源下实现高效的模型训练和推理，实现端侧模型训练的加速。

技术关键词

模型剪枝方法掩码矩阵邻居序列子模块社区结构注意力文本顶点剪枝工具指标火灾摘要计算机设备输入模块参数列表关系

系统为您推荐了相关专利信息

评论信息发布方法、设备及存储介质

帖子评论信息发布方法工作流引擎关键词主题

一种基于IOS和安卓的线下门店返利系统

线下门店返利系统营销活动信息营业执照信息数据分析模块子模块

一种用于口腔链球菌TMPC蛋白检测的单克隆抗体5E10及应用

单克隆抗体 ELISA检测系统夹心ELISA检测方法蛋白序列

一种基于图注意力网络的静态异构网络链路预测方法及系统

异构网络链路预测链路预测模型节点注意力异构网络数据

扫地机器人的路径优化方法、装置及电子设备

扫地机器人路径优化方法遗传算法优化序列非易失性存储介质

用于端侧模型训练加速的大模型剪枝方法、装置和设备

站点导航

APP 下载