摘要
本发明涉及网络通信领域,特别涉及一种基于联邦深度强化学习的虚拟网络嵌入决策方法,包括:构建物理网络子图到服务请求子图的映射关系;根据映射关系构建约束条件,将长期平均收入成本比作为优化目标,构建优化问题;将优化问题建模为马尔可夫决策过程;采用近端策略优化的联邦学习算法对智能体进行参数更新,得到优化模型;采用优化模型对马尔可夫决策过程求解,得到最优虚拟网络嵌入决策;本申请提供的虚拟网络嵌入决策方法基于跨天基、空基、地基域的资源协同机制,具备高安全性的特点,能够实现在高网络负载场景下对网络资源的动态编排。
技术关键词
深度强化学习
虚拟网络
决策方法
资源约束条件
节点
物理
学习算法
链路
整数线性规划
策略
算法框架
参数
变量
关系
动态
邻居
网络通信