摘要
本发明提供了一种基于强化学习多目标路径的自适应路由优化方法及系统,包括:获取网络路由相关数据;多目标路径优化建模,将所述相关数据中的网络状态和业务需求转化为可优化的数学模型;基于强化学习的多目标路径优化求解,利用深度强化学习DQN算法,通过训练智能体来学习最优的路由决策策略;输出最优路由路径,指导网络设备进行路由调整。本发明实现了多目标路径优化,能够同时考虑带宽、时延、丢包率等多个QoS指标,满足不同业务的差异化需求。
技术关键词
DQN算法
节点
深度强化学习
链路
决策
数学模型
网络设备
强化学习环境
QoS指标
网络拓扑信息
网络状态信息
加权有向图
智能体交互
训练智能体
智能体模型
强化学习模型
随机梯度下降
时延
系统为您推荐了相关专利信息
三维特征提取
集成方法
建模平台
特征信息提取
管网模型
磷酸铁锂
产品信息数据库
追溯方法
耐高温陶瓷
节点
缓存命中率
缓存策略
节点
提升系统
缓存替换算法