用于利用零气泡流水线并行化来训练神经网络模型的方法和设备

AITNT
正文
推荐专利
用于利用零气泡流水线并行化来训练神经网络模型的方法和设备
申请号:CN202411366375
申请日期:2024-09-29
公开号:CN119721185A
公开日期:2025-03-28
类型:发明专利
摘要
本申请公开了用于利用零气泡流水线并行化来训练神经网络模型的方法和设备。各种实施例涉及利用零气泡流水线并行化来训练神经网络模型的计算机实施的方法,该计算机实施的方法包括:通过神经网络模型执行多个正向传播,其中多个正向传播中的每个正向传播将对应输入x变换为对应输出y;通过神经网络模型执行多个反向传播,其中多个反向传播分为多个梯度计算传播B和多个参数计算传播W;针对对应输入x和对应输出y执行多个梯度计算传播B;以及确定流水线气泡以及在流水线气泡期间执行多个参数计算传播W。
技术关键词
训练神经网络模型 流水线 启发式算法 气泡 前馈神经网络 参数 计算机程序产品 内存 可读存储介质 计算机设备 处理器 指令 存储器
系统为您推荐了相关专利信息
1
一种基于柱面投影和极坐标的3D物体检测方法
物体检测方法 柱面 高层语义特征 生成多尺度 非线性映射关系
2
一种基于提示学习中关系抽取的医疗文本分类方法
医疗文本分类方法 bert模型 模版 多头注意力机制 关系
3
一种姿态特征引导的细粒度人物交互关系检测方法
姿态特征 关系检测方法 姿态结构 姿势 视觉特征
4
一种基于Transformer的任意分辨率电商详情页图像超分辨率方法
图像超分辨率方法 电商 编码器模块 超分辨率模型 计算机程序指令
5
基于DiT条件引导的多标签天气图像数据扩充方法
多标签 数据扩充方法 天气 图像 混合损失函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号