摘要
本公开涉及人工智能技术领域,提供了一种模型训练方法、模型训练装置、计算机可读存储介质、电子设备,其中,模型训练方法包括:获取训练数据,并对所述训练数据进行压缩处理,获得压缩训练数据;将所述压缩训练数据划分为多个数据子集,将所述多个数据子集分配至多个训练节点;通过所述多个训练节点基于各自分配到的数据子集对待训练的原始大模型进行并行训练,并获取每个所述训练节点基于模型预测结果所计算出来的局部模型梯度;根据多个所述局部模型梯度确定全局模型梯度,以根据所述全局模型梯度对所述待训练的原始大模型的模型参数进行更新。本公开中的方法能够在提升模型训练速度的同时,降低通信开销。
技术关键词
模型训练方法
节点
字典
数据压缩
字符串替换
模型训练装置
可读存储介质
传播算法
参数更新模块
电子设备
人工智能技术
数据处理模块
处理器
计算机
指标
内存
频率
标签
系统为您推荐了相关专利信息
底盘
模块检测方法
历史运行数据
随机森林
异常点
商品特征
定制商品
多头注意力机制
节点
商品标签
生成多媒体内容
交互内容
消息
解锁
指定时间间隔
复合翼飞机
机翼
加速度
垂直起落系统
神经网络激活函数