摘要
本发明公开了一种基于多智能体深度强化学习的电力通信系统鲁棒路由方法,包括:建立电力通信系统的信息流模型,将路由节点视为智能体,根据路由优化的目标设计智能体的观测空间、动作空间和奖励函数,将路由优化问题转化为多智能体深度强化学习问题,为每个智能体设计路由策略网络和改进评论家网络,采用Soft‑Actor‑Critic算法交替更新每个智能体的路由策略网络和改进评论家网络的参数,得到所有智能体的最优路由策略网络,用于输出最优的路由决策,当电力通信系统遭受网络攻击或发生故障时,不同智能体之间通过最优路由决策的协同,维持正常量测数据包的传输延时在允许范围内。本发明可应用于毫秒级控制的电力通信场景,使电力通信系统的通信延时和丢包率最小。
技术关键词
电力通信系统
通信链路
节点
注意力神经网络
决策
信息流模型
深度强化学习
策略
代表
邻居
联合损失函数
LSTM神经网络
编码向量
多头注意力机制
长短期记忆网络
更新网络参数
网络结构
系统为您推荐了相关专利信息
低噪声组件
体渲染方法
蒙特卡洛算法
光照
计算机程序产品
输电杆塔
节点特征
映射算法
特征金字塔网络
影像
路线规划方法
路径生成算法
障碍物
端点
水下航行器