用于端侧模型训练加速的大模型剪枝方法、装置和设备

AITNT
正文
推荐专利
用于端侧模型训练加速的大模型剪枝方法、装置和设备
申请号:CN202411894221
申请日期:2024-12-20
公开号:CN119740624A
公开日期:2025-04-01
类型:发明专利
摘要
本申请涉及一种用于端侧模型训练加速的大模型剪枝方法、装置和设备,所述方法指出端侧模型训练的主要瓶颈在于对输入序列的all‑to‑all注意力运算。all‑to‑all运算构造了一个完全图,即每个序列的token都和其余所有token建立了有向边,这种完全图是稠密结构,但是不同的token间有差异化的相似性,本方法根据token序列的差异化相似性构造系列化的稀疏图,实现了系列化、通用化的Transformer稀疏剪枝,为Transformer模型训练师提供了一套灵活的稀疏剪枝工具,通过剪除模型中不重要的参数,减少模型的计算量和存储需求,从而在有限的资源下实现高效的模型训练和推理,实现端侧模型训练的加速。
技术关键词
模型剪枝方法 掩码矩阵 邻居 序列 子模块 社区结构 注意力 文本 顶点 剪枝工具 指标 火灾 摘要 计算机设备 输入模块 参数 列表 关系
系统为您推荐了相关专利信息
1
评论信息发布方法、设备及存储介质
帖子 评论信息发布方法 工作流引擎 关键词 主题
2
一种基于IOS和安卓的线下门店返利系统
线下门店返利系统 营销活动信息 营业执照信息 数据分析模块 子模块
3
一种用于口腔链球菌TMPC蛋白检测的单克隆抗体5E10及应用
单克隆抗体 ELISA检测系统 夹心ELISA检测方法 蛋白 序列
4
一种基于图注意力网络的静态异构网络链路预测方法及系统
异构网络链路预测 链路预测模型 节点 注意力 异构网络数据
5
扫地机器人的路径优化方法、装置及电子设备
扫地机器人 路径优化方法 遗传算法优化 序列 非易失性存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号