摘要
本发明公开了一种图注意力网络强化学习抗干扰路由优化方法及装置,本发明的方法包括网络节点根据收集到的GAT网络模型的初始化权重数据更新对应的DQN模型,利用更新后的DQN模型选择最优的路由路径,并将最新的注意力机制权重参数发送至GAT网络模型;对节点特征进行处理生成更新后的节点特征集合,并根据更新后的节点特征集合和其他初始状态观测信息得到更新后的注意力机制权重参数以构建GAT网络模型;基于环境定义、状态定义、动作定义和奖励定义进行GAT‑DQN网络模型训练以得到训练好的GAT‑DQN网络模型;将训练好的GAT‑DQN网络模型用于移动自组网节点。本发明旨在增强移动自组织网络(MANET)的抗干扰能力。
技术关键词
注意力机制
节点特征
网络模型训练
网络节点
自组网
定义
参数
无线通信链路
深度强化学习
数据更新
邻居
信道
特征值
优化装置
代表
输出模块