一种基于阶段式学习的大模型加速训练方法

AITNT
正文
推荐专利
一种基于阶段式学习的大模型加速训练方法
申请号:CN202410986288
申请日期:2024-07-23
公开号:CN118940802A
公开日期:2024-11-12
类型:发明专利
摘要
本发明涉及人工智能领域的技术,提出一种基于阶段式学习的大模型加速训练方法,包括:初始化待训练的大模型,从所述大模型中选择少量初始训练层作为新增训练层组成子模型并进行训练;构建增长调度器,利用所述增长调度器判断是否触发模型增长;当触发模型增长时,构建并初始化新的训练层,作为新增训练层插入所述子模型,并通过动态调节学习率稳定增长后子模型的训练过程;重复上述步骤,直至达到预设的训练周期,得到完成训练的大模型。相较于现有技术计算资源开销大,兼容性差的问题,本发明能在显著加速模型训练的同时具备高兼容性。
技术关键词
加速训练方法 调度器 阶段 加速模型训练 自定义参数 指示器 训练系统 处理器 表达式 调节单元 动态 可读存储介质 存储器 周期 电子设备 计算机
系统为您推荐了相关专利信息
1
经由基于模拟和地面真值测量的X射线建模对样本的结构性质进行非破坏性估计
样本 X射线检测器 电路系统 图案化晶片 参数
2
一种分布式光伏可调节功率的聚合方法
基准 鲁棒优化模型 低压分布式光伏 径向基神经网络 动态特性参数
3
一种含微网群的园区配电网两阶段边云协同调度方法
协同调度方法 有功功率 风力涡轮机 储能系统 两阶段
4
一种集装箱铅封检测和记录方法及系统
集装箱铅封 集装箱图像 门锁 门把 数据记录单元
5
基于大模型的代码生成与自动程序修复的模糊测试方法及系统
自动程序修复 模糊测试方法 生成代码 阶段 纠错
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号