摘要
本发明提供一种基于迭代学习的大规模光网络资源分配方法,包括:初始化光网络拓扑和各链路频谱资源状态;每个节点的节点特征编码和每条链路的链路特征编码初始化;根据当前网络状态,动态更新vi、ej以及当前业务请求,同时生成对应Agent的输入状态SI;所述该输入状态SI被送入Agent中,作为决策的依据;逐步构建符合光路约束的可行解;强化学习所述决策;为动作计算奖励值R;更新后的奖励值R用于进一步优化Agent的决策;EGAT模型训练与优化;EGAT模型评估与仿真;结合迭代学习逐步构建服务分配策略,能够有效应对大规模网络拓扑变化,显著提高调度的全局性能与效率。
技术关键词
网络资源分配方法
节点特征
链路
编码
动态更新
网络拓扑变化
决策
神经网络结构
注意力
波长
传播算法
光网络
因子
关系
源节点
节点数
终点