摘要
本发明公开一种SDWN中基于多智能体图强化学习的多对多通信路由方法,首先设计了一种基于Q‑learning强化学习算法,优化部署智能体的网络节点数量,从而降低现有方法对所有网络节点部署智能体带来的计算和部署成本;然后在AC框架下的设计了一种集中式训练分布式执行的多智能体深度强化学习算法,为了减少模型训练的存储空间开销分别使用图卷积神经网络和图神经网络重新设计Actor和Critic的网络结构,解决了现有方法中卷积神经网络对拓扑结构数据适应能力比较弱的问题;最后提出动作空间局部观测方法来避免无效动作的生成,从而降低模型训练的时间开销并加快收敛速度,从而降低模型训练的时间开销并加快收敛速度。
技术关键词
智能网络节点
网络节点集合
网络节点数量
编码
深度强化学习算法
拓扑结构数据
能耗
网络拓扑信息
队列
智能体交互
决策
邻居
观测方法
特征选择
网络结构
样本
系统为您推荐了相关专利信息
逆向设计方法
拓扑优化方法
神经网络架构
水平集方法
水平集函数
打磨控制方法
运动状态信息
边缘轮廓
轴承盖
路径规划算法
时空注意力机制
轨迹预测方法
轨迹预测模型
多头注意力机制
门控循环单元