深度学习模型训练方法及显存优化装置

正文

推荐专利

深度学习模型训练方法及显存优化装置

申请号：CN202510994608

申请日期：2025-07-18

公开号：CN120909776A

公开日期：2025-11-07

类型：发明专利

摘要

公开了一种深度学习模型训练方法及显存优化装置。所述方法包括：在第一训练阶段，获取该阶段中各个张量的显存生命周期信息和显存大小信息；根据显存生命周期信息进行张量分类，并根据张量分类结果和显存大小信息生成显存分配方案；在第二训练阶段，基于显存分配方案进行显存分配。本公开利用模型训练中可预测的分配模式先验知识来提前规划显存分配，在不影响训练性能的基础上有效地降低显存碎片，进而提升训练过程中的资源使用效率。本公开还可通过对临时张量按大小分组的空间聚合以及聚合前的张量合并来提升显存分配方案的生成效率，并通过引入静态结合动态的显存分配器使得本公开的显存优化方案在稠密和MoE模型上均实现高效显存分配。

技术关键词

动态分配器优化装置周期分析组件深度学习模型训练阶段分析模块优化器离线错误检测节点指针报告模式参数

系统为您推荐了相关专利信息

一种通用的基于人工智能的文本内容分析和推理系统

推理系统分析单元文本推理规则标记

一种农业知识图谱构建与检索方法

智能决策模型自然语言检索方法智能决策支持系统深度学习模型训练

电池管理系统的数据处理方法和电池管理系统

电池管理系统数据处理方法队列参数储能系统

一种Ku波段星链下行信号检测方法

信号检测方法宽带接收机谱峰位置周期采样率

一种支撑均衡计算的可控负荷聚类方法及系统

负荷聚类方法聚类系统功率物理电力

深度学习模型训练方法及显存优化装置

站点导航

APP 下载