一种基于阶段式学习的大模型加速训练方法

正文

推荐专利

一种基于阶段式学习的大模型加速训练方法

申请号：CN202410986288

申请日期：2024-07-23

公开号：CN118940802A

公开日期：2024-11-12

类型：发明专利

摘要

本发明涉及人工智能领域的技术，提出一种基于阶段式学习的大模型加速训练方法，包括：初始化待训练的大模型，从所述大模型中选择少量初始训练层作为新增训练层组成子模型并进行训练；构建增长调度器，利用所述增长调度器判断是否触发模型增长；当触发模型增长时，构建并初始化新的训练层，作为新增训练层插入所述子模型，并通过动态调节学习率稳定增长后子模型的训练过程；重复上述步骤，直至达到预设的训练周期，得到完成训练的大模型。相较于现有技术计算资源开销大，兼容性差的问题，本发明能在显著加速模型训练的同时具备高兼容性。

技术关键词

加速训练方法调度器阶段加速模型训练自定义参数指示器训练系统处理器表达式调节单元动态可读存储介质存储器周期电子设备计算机

系统为您推荐了相关专利信息

经由基于模拟和地面真值测量的X射线建模对样本的结构性质进行非破坏性估计

样本 X射线检测器电路系统图案化晶片参数

一种分布式光伏可调节功率的聚合方法

基准鲁棒优化模型低压分布式光伏径向基神经网络动态特性参数

一种含微网群的园区配电网两阶段边云协同调度方法

协同调度方法有功功率风力涡轮机储能系统两阶段

一种集装箱铅封检测和记录方法及系统

集装箱铅封集装箱图像门锁门把数据记录单元

基于大模型的代码生成与自动程序修复的模糊测试方法及系统

自动程序修复模糊测试方法生成代码阶段纠错

一种基于阶段式学习的大模型加速训练方法

站点导航

APP 下载