摘要
本发明提供一种基于多智能体深度强化学习的多层卫星网络路由方法、系统,所述方法包括以下步骤:多个低轨卫星采用分布式的多智能体强化学习算法训练各自的执行者网络以实现路由决策;一个中轨卫星根据所述多个低轨卫星上传的所述执行者网络的局部参数训练全局评价网络,并将训练好的全局评价网络的全局参数提供至每个低轨卫星,以使所述低轨卫星根据所述全局参数更新各自的局部评价网络,并根据更新后的局部评价网络更新各自的执行者网络。本发明的基于多智能体深度强化学习的多层卫星网络路由方法、系统能够在中低轨卫星网络中实现路由策略的动态最优化,显著提高了卫星网络的整体性能。
技术关键词
多智能体深度强化学习
卫星网络环境
强化学习算法
多智能体强化学习
决策
拥塞信息
参数
切片
链路
轨道
能耗
策略
动态
系统为您推荐了相关专利信息
智能故障诊断方法
断路器电机
模糊规则推理
电机驱动机构
故障特征
优化调控方法
优化调控模型
能源
机会约束规划
风险
石墨烯薄膜
温控系统
MOSFET驱动电路
温度传感器模块
微控制器
测试评估系统
智能决策支持
数据处理模块
渗滤液
数据采集模块