摘要
本发明提供一种深度强化学习和联邦学习的多层卫星网络路由方法及系统,所述方法包括以下步骤:多个低轨卫星采用分布式的深度强化学习算法训练各自的执行者网络以实现路由决策,训练各自的评价网络以实现所述执行者网络的本地评价;一个中轨卫星根据所述多个低轨卫星上传的所述评价网络的评价网络参数,基于联邦学习算法生成全局评价网络,并将训练好的全局评价网络的全局评价参数提供至每个低轨卫星,以使所述低轨卫星根据所述全局评价参数更新各自的评价网络,并根据更新后的评价网络更新各自的执行者网络。本发明的深度强化学习和联邦学习的多层卫星网络路由方法及系统基于联邦学习技术和深度强化学习技术实现卫星路由的动态最优化。
技术关键词
深度强化学习算法
卫星网络环境
参数
决策
深度强化学习技术
拥塞信息
联邦学习技术
切片
链路
轨道
能耗
动态
系统为您推荐了相关专利信息
考试管理系统
答题纸
智能组卷
考试管理方法
试卷管理
样本
优劣解距离法
执行增量
模型训练技术
数据分析模块
预警预报系统
子模块
监测模块
海洋垃圾
水动力模型