摘要
本发明公开了基于分块交错流水线的模型更新方法、装置、设备及产品,所述方法包括:接收中央处理器当前发送的待更新数据块;其中,待更新数据块包括:模型参数分块和对应的优化器状态分块;根据本次模型迭代计算生成的梯度数据,对待更新数据块进行更新,得到已更新数据块,并将已更新数据块卸载至中央处理器;在卸载已更新数据块时,接收中央处理器发送的下一个待更新数据块,以在图形处理器中完成下一个待更新数据块的更新和卸载处理。本发明能够显著地减少显存需求,并通过预加载机制,充分利用计算资源和通信资源的时序重叠性,进而有效地提高了数据更新的效率。
技术关键词
模型更新方法
分块
中央处理器
图形处理器
流水线
人工智能处理器
模型更新装置
优化器
预加载机制
可读存储介质
内存
参数
预取模块
计算机程序产品
精度
副本
数据更新
系统为您推荐了相关专利信息
置信度评估方法
概率密度函数
传感器
方程
表达式
可编程逻辑模块
基板管理控制器
输入输出接口
处理器模块
通用串行总线接口