摘要
本发明公开一种基于深度强化学习的智能分段路由方法,使用AC框架下的SAC算法作为核心框架,以全局网络状态信息的流量矩阵、结合网络拓扑、SR标签栈深度作为智能体的状态空间。智能体不仅考虑路径规划选择下一条交换机节点的动作选择策略,还设计了新加入交换机节点是否选择为粘连交换机节点的动作选择策略,并设计了考虑优化转发路径因素和控制器对粘连交换机节点下发流表时间开销因素的奖励函数形式。本发明在SDN架构下建立了能同时求解路径规划方案和最优分段路由粘连交换机节点选择策略的最优化模型,考虑了控制器对最优粘连交换机节点流表下发时间开销,最大限度的提高了流表下发速度和分段路由的性能。
技术关键词
交换机
节点
深度强化学习
链路丢包率
网络状态信息
矩阵
时延
网络拓扑信息
分段
邻居
软件定义网络
标签
SAC算法
控制器
策略
代表
规划
框架
系统为您推荐了相关专利信息
直流潮流模型
节点导纳矩阵
支路有功潮流
建模方法
建模装置
电推进系统
飞机整流罩
散热结构
进气口
深度强化学习方法
数据查询请求
数据查询方法
自然语言模型
查询词语
图谱
芯片封装测试方法
BGA芯片
接触面结构
焊球
振动响应参数