摘要
本发明提供了一种基于深度强化学习的边缘服务器动态激活方法及系统,包括如下步骤:S1,构建系统模型,包括构建网络模型、能耗模型、通信与服务延迟模型以及状态切换成本模型,网络模型包括RES和MES;S2,通过计算能耗模型、通信与服务延迟模型以及状态切换成本模型的成本之和,优化网络模型;S3,构建马尔科夫决策过程模型,提升RES稳定性;S4,预测流量负载;S5,计算基线值;S6,通过集中式智能调度算法CDDS训练网络模型,得到训练后的策略网络模型;S7,通过联邦式分布式智能调度算法FDDS,对训练后的策略网络模型进行划分并基于联邦学习训练模型,得到DDPG模型;S8,将DDPG模型部署至各RES。
技术关键词
深度强化学习
激活方法
策略网络模型
智能调度算法
分布式智能
构建系统模型
仿生智能算法
基线
ARIMA模型
动态
深度确定性策略梯度
网络流量数据集
贪婪策略
能耗
网络节点集合
决策
服务器节点
系统为您推荐了相关专利信息
频谱接入方法
LEO卫星
信道
深度强化学习方法
多智能体强化学习
通信资源分配方法
深度强化学习
隐马尔可夫模型
注意力机制
通信资源分配系统
学习训练方法
记忆
深度强化学习算法
末端执行器
阶段
机器人路径规划
模型训练方法
路径规划方法
温室
数学模型
经济管理系统
矿产资源勘探
经济效益评估
矿山生态修复
Dijkstra算法