摘要
本发明公开一种基于DRL和跨层优化的分布式数据链自组网路由构建方法,当接收到从源节点到目的节点的数据流通信请求时,将待建立的端到端数据流抽象为部分可观测马尔可夫逐跳决策过程,其中每一跳仅由当前节点基于局部观测信息进行路由与发射功率的联合决策。本发明在每个跳的决策中,使用图来灵活地描述邻近节点之间的不规则拓扑和干扰关系;设计基于GNN的模型架构作为代理节点的策略,利用图关系处理输入/输出的波动维度;优化过程中,节点之间的信息交换严格遵循其感知能力的实际限制,符合数据链自组织网络的分布式配置;学习后的策略可以快速建立源节点和目标节点之间的高质量路由路径,表现出对随机网络拓扑的强大泛化能力。
技术关键词
自组网
决策
中继节点
强化学习策略
邻居
计算机程序产品
网络拓扑
分布式配置
Q学习算法
源节点
路径跳数
通信接口
瓶颈
链路
贪婪策略
定义