摘要
本发明公开了一种边缘环境下基于深度强化学习的任务卸载方法与系统。方法包括:构建包含网络、任务、任务完成时间的系统模型,其中网络模型涵盖边缘服务器、用户及任务,任务模型描述任务到达间隔与截止时间,任务完成时间模型包含传输、排队和计算时延;结合模型与优化目标,构建以最大化任务截止时间与完成时间差值为目标的函数及约束条件;建立深度强化学习模型,定义包含任务信息、带宽和服务器负载的状态空间,以本地计算和卸载至各边缘服务器比例为动作空间,并设计归一化的奖赏函数;基于模型,通过动作空间优化、策略梯度训练和引入超参数,调整任务卸载策略,获取更优方案。本发明能够在较低的时间复杂度内得到更优的结果。
技术关键词
深度强化学习模型
任务分配算法
卸载方法
卸载策略
时延
服务器节点
超参数
网络
模型训练模块
卸载系统
系统模块
处理器
先进先出
定义
计算机设备