摘要
本公开涉及一种大语言模型对齐方法及装置、电子设备和存储介质,该方法包括:将大语言模型的对齐流程划分为多个阶段;确定各所述阶段的子阶段,以及各所述阶段对应的阶段内策略,所述阶段内策略表征训练时模块对硬件的共享策略以及模块的执行顺序;确定阶段间策略,所述阶段间策略表征不同所述阶段对应的并行训练方式;按照各所述阶段内策略和各所述阶段间策略对待对齐模型进行对齐,得到目标模型。在对齐过程中,为各阶段确定出对应的阶段内策略、阶段间策略,考虑了上下文切换过程中可能的效率优化可能性,以及并行训练方式转换过程中可能存在的效率优化的机会,提高了对齐训练的效率和硬件资源的利用率。
技术关键词
阶段
策略
负载特征
大语言模型
多模块
对齐方法
非易失性计算机可读存储介质
计算机程序指令
对齐系统
电子设备
管道
处理器
存储器
通讯
数据
系统为您推荐了相关专利信息
故障预警系统
故障特征
多层次
能源系统
贝叶斯网络学习方法
时序预测方法
小批量生产
数据
时序预测模型
长短期记忆网络
车辆控制方法
车辆状态数据
悬架系统
地面
感知装置