一种面向移动设备的分布式Transformer大模型训练方法

正文

推荐专利

申请号：CN202411723727

申请日期：2024-11-28

公开号：CN119808888B

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种面向移动设备的分布式Transformer大模型训练方法。在Transformer大模型的分布式训练过程中，对于参与训练的每一个移动设备，收集各异构处理器的计算资源，并基于此将Transformer中不同数量的自注意力头分配到异构处理器上进行并行计算，实现Transformer大模型中自注意力机制在移动设备上的计算加速；容错恢复过程对分布式训练过程中由于移动设备的动态性产生的可预测性故障进行提前处理，使分布式训练在不因故障而中断的情况下完成容错恢复。本发明充分利用移动设备的动态性及其多个处理器的计算资源，实现Transformer模型在移动设备上高效鲁棒的分布式训练。

技术关键词

移动设备分布式训练模型训练方法异构局域网设备分布式协同恢复算法广播设备多处理器恢复方法检查方法注意力机制笔记本电脑通知台式机智能终端定义单片机

一种面向移动设备的分布式Transformer大模型训练方法

站点导航

APP 下载