摘要
本发明涉及边缘计算的技术领域,具体为基于DQN算法的边缘计算卸载决策系统;包括环境建模单元、状态空间构建单元、动作决策单元、奖励反馈单元、训练与优化单元、仿真验证单元,其中:所述环境建模单元:用于对边缘计算卸载决策所处的终端设备的异构性、任务特征的多维度性、基站信道的多样性以及边缘服务器资源管理的多维度因素进行建模。通过通过ε‑greedy策略的指数衰减机制,提升了收敛速度,并且采用Dueling Double DQN架构,通过价值函数与优势函数分离,解决了过高估计问题,继续提高了收敛速度,同时提出动态Gamma值调整策略使任务成功率上升,收敛最终效果变好。
技术关键词
DQN算法
决策系统
终端设备
服务器资源管理
归一化模块
网络模块
回放模块
基站
搭建模块
网络通信环境
信道
模拟真实世界
仿真环境
参数
生成机制