摘要
本发明公开了一种基于确定性策略梯度强化学习算法的OTN专网运行过程优化方法,包括以下步骤:1)构建OTN专网运行过程的数字孪生模型;2)采用基于深度确定性策略梯度算法DDPG的强化学习方法,实现OTN专网运行过程优化配置;构建强化学习的环境模型,并基于此构建强化学习算法的状态空间、动作空间和奖励函数实现基于深度确定性策略梯度算法强化学习方法的OTN专网运行过程优化配置。本发明在数字孪生模型的基础上,提出了基于强化学习的OTN专网运行过程优化方法,可以有效提升OTN专网的智能化运维程度。
技术关键词
强化学习算法
数字孪生模型
确定性策略梯度
专网
强化学习方法
链路
强化学习网络训练
更新网络参数
网络仿真工具
节点状态信息
智能化运维
网络流量数据
网络拓扑结构
功耗
处理器
系统为您推荐了相关专利信息
氢气检测单元
监测方法
信号收发器
分布式传感网络
数字孪生模型
波束
跟踪方法
无人机姿态
飞行控制系统
深度学习技术
储能调度方法
决策网络模型
神经网络参数
电网系统
新能源机组
协议特征
插件管理器
时钟
数据格式
数字孪生模型