摘要
本发明公开了一种多路径路由方法、装置、介质和设备,涉及网络通信技术领域。先获取当前时刻各网络节点的拓扑信息、各网络节点的状态信息和各待转发的数据流的信息,形成当前时刻的状态空间,再针对每个待进行数据流转发的网络节点,确定该网络节点在当前时刻所要转发的数据流,并根据当前时刻该网络节点的度确定该网络节点转发动作的动作空间,从而根据状态空间和动作空间确定该网络节点的转发动作,即所要转发的数据流的下一途径网络节点,最后通过逐时刻多轮迭代确定各待转发的数据流的路由路径。通过将待转发数据流的路由确定过程拆分为单个网络节点逐时刻的下一跳确定过程,降低了资源消耗提高了收敛效率,提高了灵活性和负载均衡能力。
技术关键词
强化学习模型
多路径
网络节点间链路
网络通信技术
短距离
云端服务器
处理器
生成随机
计算机设备
可读存储介质
模块
存储器
策略
时延
数据
因子
算法
系统为您推荐了相关专利信息
联合优调优控方法
巷道结构
鸽群优化算法
矿井智能
强化学习模型
强化学习模型
网络状态信息
集合通信方法
策略
计算机设备
车辆周围环境
强化学习模型
运动状态信息
因子
采样点
边界扫描测试装置
边界扫描器件
多路径
网络测试环境
测试模块