摘要
本说明书公开了一种模型训练和业务执行方法、装置、存储介质及设备。所述模型训练方法包括:根据预设的数据并行维度和序列并行维度将样本数据切分为多个子样本,并将各子样本分配到不同的图形处理器GPU上;针对每个GPU,在将分配到该GPU上的子样本输入部署在该GPU上的目标模型后,确定目标模型中的每一个子层所对应的激活值并存储,其中,针对每个子层,若该子层对应的层级小于指定层级,则将该子层对应的激活值存储到中央处理器CPU中,并在该GPU中将该子层对应的激活值进行删除;确定目标模型的损失值,并根据损失值以及每个子层所对应的激活值,对目标模型进行训练。本方案有效提高了模型的训练效率和GPU的利用率。
技术关键词
网络模块
层级
业务执行方法
图形处理器
中央处理器
注意力
模型训练方法
归一化模块
投影模块
样本
编码模块
模型训练装置
数据通信
序列
多层感知机
键值
输入模块
系统为您推荐了相关专利信息
分支卷积神经网络
饲喂方法
感兴趣
体重
卷积模块
CT图像生成方法
注意力
转换编码器
图像生成模型
通道
通信模组
麻醉深度评估
高级生命支持
模糊规则
废气收集器