交错式流水线并行训练方法、装置、设备、存储介质和程序产品

AITNT
正文
推荐专利
交错式流水线并行训练方法、装置、设备、存储介质和程序产品
申请号:CN202411968005
申请日期:2024-12-30
公开号:CN119376796B
公开日期:2025-07-29
类型:发明专利
摘要
本发明实施方式公开了交错式流水线并行训练方法、装置、设备、存储介质和程序产品,属于人工智能技术领域。方法包括:基于计算单元数、分块数和大模型的总层数,确定每个分块包含的层数,其中每个分块包含的层数是可配置的;基于计算单元数、分块数和大模型的总层数,确定每个分块包含的层数包括下列中的一个:基于计算单元数、分块数和总层数,以气泡时间为指标而确定每个分块包含的层数;基于计算单元数、分块数和总层数,以显存消耗为指标而确定每个分块包含的层数;基于计算单元数、分块数和总层数,以气泡时间和显存消耗为指标而确定每个分块包含的层数;基于每个分块包含的层数,对大模型执行交错式流水线并行训练。可以提高训练效率。
技术关键词
分块 并行训练方法 气泡 流水线 指标 计算机可读指令 处理器 可读存储介质 人工智能技术 训练装置 模块 程序 存储器 电子设备
系统为您推荐了相关专利信息
1
基于GIS驱动的商业地块空间关联可视化分析方法
可视化分析方法 商业 流场可视化 动态网络结构 attention机制
2
一种基于数据库的智能逻辑处理方法、设备及介质
发布者 深度Q网络 逻辑 日志 算法
3
基于关键指标的农业产业经济风险跟踪预警方法及系统
跟踪预警方法 预警模块 风险 输出预警信息 物联网传感器
4
基于分层分析模型的车险保费预测方法、装置、计算机设备及存储介质
XGBoost模型 预测残差 动态 分层 路况因子
5
测试项目确定方法、装置、电子设备和存储介质
树状结构 信号 层级 电子设备 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号