摘要
本发明属于强化学习决策和网络通信领域,尤其涉及一种基于强化学习的网络拥塞路由选择方法。解决了传统负载均衡解决网络路由拥塞的方式的固定限制,在满足达到指定终点路由节点的前提下,随机选取中间路由节点和到达该阶段的线路,后依据数据传输效率和路由拥塞范式给出评判,以此来获取信息充足的状态数据。同时路由间的线路不唯一,以此来模拟实际网络通信场景中的复杂状态,进而获取多样化、多表征状态的数据,提升模型的鲁棒性,使得网络路由决策分析更为贴合实际。
技术关键词
强化学习模型
线路
交叉注意力机制
决策
节点
深度确定性策略
定义
数据
网络通信
推理网络
样本
有效性
理论
关系
鲁棒性
场景
阶段
系统为您推荐了相关专利信息
需求响应分析方法
风光分布式电源
调控模型
需求响应资源
抽蓄装置
轨道机器人
智能仓库管理系统
货架
节点
数据采集终端
节点
数据传输资源
历史设备
计算机程序产品
统一资源定位符
贝叶斯网络模型
节点
评估指标体系
贝叶斯方法
三角模糊数
封口
工艺优化方法
数学模型
多模态传感器
工艺设备