摘要
本发明公开了一种基于元强化学习的任务卸载方法,包括建立多用户单边缘服务器的卸载任务场景,将任务分解为子任务;根据用户设备的信息将卸载任务建模为有向无环图,获得有向无环图的特征信息;构建基于GRU注意力机制的序列到序列网络模型,将有向无环图的特征信息输入到该网络模型中,得到不同任务的卸载序列;基于有向无环图的特征信息,计算本地任务处理以及边缘任务卸载的总延迟和总能耗;将边缘任务卸载建模为马尔可夫决策模型,根据时延与能耗获得状态函数、动作函数和奖励函数;获取MR‑TD3算法,利用该算法对工作负载和资源分配进行处理,完成任务的卸载。本发明提高了学习的样本效率和稳定性。
技术关键词
GRU注意力机制
卸载方法
有向无环图
网络
能耗
决策
服务器
算法
解码器
序列
表达式
编码器
剪切噪声
参数
转移概率矩阵
资源分配
策略
门控循环单元
动作环境
系统为您推荐了相关专利信息
特征提取模块
多维度特征提取
生成参数
生成平台
图像生成方法
颤振检测方法
分类器
门控循环单元
前馈神经网络
支持向量机
半双工通信
资源
混合自动重传请求
时间段
存储器
涡旋压缩机
故障检测系统
压缩机故障
润滑油
故障检测模块