摘要
本申请涉及一种模型训练方法、装置和计算机设备,从图形处理器GPU中,获取训练模型的本轮次梯度数据;获取的本轮次梯度数据的数据格式为整数型;并根据本轮次梯度数据和训练模型的本轮次模型参数,确定训练模型的下一轮次模型参数;进而将下一轮次模型参数发送至GPU,以使GPU基于下一轮次模型参数进行前向传播和反向传播,得到训练模型的下一轮次梯度数据。上述方案,GPU与CPU之间进行各轮次梯度数据传播时,各轮次梯度数据为整数型,缩减了数据传输量,提高了数据传输效率,进而提高了模型训练的效率。
技术关键词
数据格式
图形处理器
模型训练方法
参数
模型训练装置
计算机设备
精度
中央处理器
模块
存储器
系统为您推荐了相关专利信息
轨迹分类方法
船舶
滑动窗口
神经网络模型
离群点
健康监测系统
健康监测方法
子模块
多模态
电化学传感器
金属有机框架
性能预测模型
性能预测方法
模型超参数
图像