摘要
本发明属于移动边缘计算技术领域,具体涉及一种基于分层深度强化学习的边缘服务缓存与任务卸载联合优化方法;该方法包括:构建通信系统模型并计算系统任务处理总时延;根据系统任务处理总时延构建优化目标函数,并将目标函数拆分为第一子问题和第二子问题;根据两个子问题构建各自的马尔科夫决策过程;构建马尔科夫决策过程包括定义状态空间、动作空间以及奖励函数;使用DQN算法求解第一子问题的马尔科夫决策过程,得到服务缓存决策方案;使用DDPG算法求解第二子问题的马尔科夫决策过程,得到任务卸载和计算资源分配方案;本发明可以进一步优化网络服务,降低平均任务处理时延。
技术关键词
联合优化方法
深度强化学习
决策
时延
云服务器
资源分配
连续动作空间
通信系统
分层
DQN算法
移动边缘计算技术
优化网络服务
内存
节点
定义
比率
异构
系统为您推荐了相关专利信息
反馈系统
微处理器
数据分析单元
卡尔曼滤波模型
实时数据
选址方法
多源时空数据
长短期记忆网络
耕地
神经网络模型
车辆行驶数据
决策树算法
车联网大数据
节点
识别方法