模型训练方法及装置、计算机可读存储介质、电子设备

正文

推荐专利

申请号：CN202410733642

申请日期：2024-06-06

公开号：CN118734065A

公开日期：2024-10-01

类型：发明专利

摘要

本公开涉及人工智能技术领域，提供了一种模型训练方法、模型训练装置、计算机可读存储介质、电子设备，其中，模型训练方法包括：获取训练数据，并对所述训练数据进行压缩处理，获得压缩训练数据；将所述压缩训练数据划分为多个数据子集，将所述多个数据子集分配至多个训练节点；通过所述多个训练节点基于各自分配到的数据子集对待训练的原始大模型进行并行训练，并获取每个所述训练节点基于模型预测结果所计算出来的局部模型梯度；根据多个所述局部模型梯度确定全局模型梯度，以根据所述全局模型梯度对所述待训练的原始大模型的模型参数进行更新。本公开中的方法能够在提升模型训练速度的同时，降低通信开销。

技术关键词

模型训练方法节点字典数据压缩字符串替换模型训练装置可读存储介质传播算法参数更新模块电子设备人工智能技术数据处理模块处理器计算机指标内存频率标签

系统为您推荐了相关专利信息

一种应用于一体化储氢底盘的多模块检测方法、系统及介质

底盘模块检测方法历史运行数据随机森林异常点

个性定制商品标签的生成方法、装置、设备及存储介质

商品特征定制商品多头注意力机制节点商品标签

多媒体内容处理方法、装置、电子设备、介质和程序产品

生成多媒体内容交互内容消息解锁指定时间间隔

垂起复合翼飞机控制方法、装置、设备及存储介质

复合翼飞机机翼加速度垂直起落系统神经网络激活函数

一种基于多策略协同的布料出库排程方法及系统

订单排程方法多策略指标彩票

模型训练方法及装置、计算机可读存储介质、电子设备

站点导航

APP 下载