摘要
本发明提出了一种基于深度强化学习的分布式试验网络拓扑优化方法,包括:构建图数据结构;初始化处理;配置奖励计算选择参数以及初始化行动和状态选择参数;依次进行第一算法以及第二算法,并输出准确率,若大于准确率预设值,则所述奖励计算选择参数表征为所述第一算法,否则为所述第二算法,重复上述过程。本发明用深度强化学习代替人工,对大规模试验的节点网络进行部署方案优化的方案。这种方法能有效节约人工,并且可适应现场情况快速进行重新计算,能在大规模计算中对少数几个节点的情况变化做出优化处理。
技术关键词
网络拓扑优化方法
深度强化学习
算法
计算机存储介质
参数
图表
处理器
节点
电子设备
数据更新
策略
网络结构
存储器
标签
有效性
序列
关系
系统为您推荐了相关专利信息
面向全过程
协同管理方法
分解特征
文本特征向量
标签
标记标签
营销推荐系统
数据采集模块
调频
关键词
肥厚型梗阻性心肌病
左心室
心动周期
二尖瓣
患者