基于数据并行与模型并行的神经网络整合训练方法及系统

AITNT
正文
推荐专利
基于数据并行与模型并行的神经网络整合训练方法及系统
申请号:CN202411927046
申请日期:2024-12-25
公开号:CN119849557B
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了基于数据并行与模型并行的神经网络整合训练方法及系统,方法包括:在若干训练单元上分别部署目标神经网络的卷积神经网络结构和全连接层分割结构;按数据并行的方式完成各卷积神经网络结构的计算,按模型并行的方式完成各全连接层分割结构的计算;合并各全连接层分割结构的输出,得到训练预测值;利用训练预测值,通过改进的Softmax方法计算各全连接层分割结构的损失函数和反向传播梯度,并将反向传播梯度同步更新至各卷积神经网络结构;重复上述步骤,完成目标神经网络的训练。本发明能够在保证高效性的同时,显著降低显存消耗,减少通信开销,优化计算负载的分配,提供更强的扩展性,为大规模神经网络的训练提供更加高效、可靠的解决方案。
技术关键词
卷积神经网络结构 训练系统 数据并行处理 参数更新模块 指数 计算方法 标签 视频 框架 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号