一种低轨卫星异构场景下低时延的大模型训练方法

AITNT
正文
推荐专利
一种低轨卫星异构场景下低时延的大模型训练方法
申请号:CN202510970629
申请日期:2025-07-15
公开号:CN120750398A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种低轨卫星异构场景下低时延的大模型训练方法,其特点是该方法利用循环Transformer的特点,将计算负载和存储开销划分到一组卫星上以实现协同训练,并在此基础上根据卫星资源异构的特点,利用动态规划的算法合理划分单颗卫星的计算负载以实现多组卫星的低时延同步,且仅依赖星间链路而不依赖星地链路以提升训练效率和可靠性。本发明与现有技术相比具有不依赖于中心集群,合理分配低轨卫星任务以完成在轨计算,降低了成本,并且根据卫星资源动态进行计算任务划分,能够在复杂模型训练时有效缓解系统的训练时延,以提升模型训练效率,应用前景良好。
技术关键词
编码器模块 模型训练方法 时延 动态规划算法 异构 流水线 参数 复用编码器 场景 浮点操作数 资源分配策略 最小化系统 星地链路 数据 轨道 训练算法 卫星系统 训练系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号