模型训练方法及装置

AITNT
正文
推荐专利
模型训练方法及装置
申请号:CN202411098120
申请日期:2024-08-09
公开号:CN118863002A
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供一种模型训练方法及装置,所述方法包括:在模型反向计算时,在各芯片上,基于各芯片上对应的当前训练数据,计算各芯片上当前训练数据的单卡局部梯度,当前训练数据是各芯片上批次训练数据中的部分训练数据;将任一芯片作为目标芯片,并将其余芯片上的单卡局部梯度同步至目标芯片;在目标芯片上,基于所有芯片的单卡局部梯度,确定模型的单卡全局梯度;基于单卡全局梯度,在目标芯片上更新模型参数。本发明提供的模型训练方法及装置,能够减小显存占用且通信量较小。
技术关键词
模型训练方法 芯片 更新模型参数 数据 非暂态计算机可读存储介质 模型训练装置 处理器 计算机程序产品 同步单元 通信量 存储器 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号