深度学习模型训练方法及显存优化装置

AITNT
正文
推荐专利
深度学习模型训练方法及显存优化装置
申请号:CN202510994608
申请日期:2025-07-18
公开号:CN120909776A
公开日期:2025-11-07
类型:发明专利
摘要
公开了一种深度学习模型训练方法及显存优化装置。所述方法包括:在第一训练阶段,获取该阶段中各个张量的显存生命周期信息和显存大小信息;根据显存生命周期信息进行张量分类,并根据张量分类结果和显存大小信息生成显存分配方案;在第二训练阶段,基于显存分配方案进行显存分配。本公开利用模型训练中可预测的分配模式先验知识来提前规划显存分配,在不影响训练性能的基础上有效地降低显存碎片,进而提升训练过程中的资源使用效率。本公开还可通过对临时张量按大小分组的空间聚合以及聚合前的张量合并来提升显存分配方案的生成效率,并通过引入静态结合动态的显存分配器使得本公开的显存优化方案在稠密和MoE模型上均实现高效显存分配。
技术关键词
动态分配器 优化装置 周期 分析组件 深度学习模型训练 阶段 分析模块 优化器 离线 错误检测 节点 指针 报告 模式 参数
系统为您推荐了相关专利信息
1
一种通用的基于人工智能的文本内容分析和推理系统
推理系统 分析单元 文本 推理规则 标记
2
一种农业知识图谱构建与检索方法
智能决策模型 自然语言 检索方法 智能决策支持系统 深度学习模型训练
3
电池管理系统的数据处理方法和电池管理系统
电池管理系统 数据处理方法 队列 参数 储能系统
4
一种Ku波段星链下行信号检测方法
信号检测方法 宽带接收机 谱峰位置 周期 采样率
5
一种支撑均衡计算的可控负荷聚类方法及系统
负荷聚类方法 聚类系统 功率 物理 电力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号