摘要
本发明提供一种基于深度强化学习的移动边缘计算资源分配方法,具体步骤包括:初始化系统参数,并将移动设备的实时数据输入系统;根据概率随机选择动作,将当前的状态输入到主网络中,通过DQN算法计算每个可能的动作迁徙任务量比例及计算资源分配比例,选择最优动作;执行最优动作后,下载移动设备和边缘服务器的处理结果,并得到奖励和下一时刻的状态;将最优动作及执行后的奖励和下一时刻的状态作为转移样本存入经验池中,通过梯度下降法更新主网络的权重参数;计算移动设备的总成本和系统中所有用户的成本。本发明将深度强化学习应用于5G关键技术之一的移动边缘计算技术,制定了移动设备的资源分配策略,显著减少了移动设备的成本。
技术关键词
深度强化学习
资源分配方法
移动设备
DQN算法
梯度下降法
初始化系统
移动边缘计算技术
实时数据
参数
噪声功率谱密度
时延
输入系统
网络
能耗
资源分配策略
服务器
可再生能源
样本
处理器
电子装置