一种模型训练和业务执行方法、装置、存储介质及设备

正文

推荐专利

申请号：CN202411628434

申请日期：2024-11-14

公开号：CN119150804B

公开日期：2025-03-18

类型：发明专利

摘要

本说明书公开了一种模型训练和业务执行方法、装置、存储介质及设备。所述模型训练方法包括：根据预设的数据并行维度和序列并行维度将样本数据切分为多个子样本，并将各子样本分配到不同的图形处理器GPU上；针对每个GPU，在将分配到该GPU上的子样本输入部署在该GPU上的目标模型后，确定目标模型中的每一个子层所对应的激活值并存储，其中，针对每个子层，若该子层对应的层级小于指定层级，则将该子层对应的激活值存储到中央处理器CPU中，并在该GPU中将该子层对应的激活值进行删除；确定目标模型的损失值，并根据损失值以及每个子层所对应的激活值，对目标模型进行训练。本方案有效提高了模型的训练效率和GPU的利用率。

技术关键词

网络模块层级业务执行方法图形处理器中央处理器注意力模型训练方法归一化模块投影模块样本编码模块模型训练装置数据通信序列多层感知机键值输入模块

系统为您推荐了相关专利信息

一种基于母猪体况的饲喂方法及系统

分支卷积神经网络饲喂方法感兴趣体重卷积模块

文件分类方法、装置、设备及可读存储介质

层级分类结构节点文件分类方法文本

基于双空间约束的增强CT图像生成方法和设备

CT图像生成方法注意力转换编码器图像生成模型通道

一种基于大模型的营销知识库构建系统及方法

知识库构建方法知识点场景主题汽车

一种麻醉监护高级生命支持一体机及其方法

通信模组麻醉深度评估高级生命支持模糊规则废气收集器

一种模型训练和业务执行方法、装置、存储介质及设备

站点导航

APP 下载