摘要
本发明涉及深度强化学习技术领域,具体涉及一种基于交替迭代优化的深度确定性梯度策略计算卸载方法,在物联网设备与边缘计算服务器节点协作式应用场景下建立任务卸载决策模型,并通过将模型中耦合的终端设备卸载策略、边缘节点资源分配及位置部署变量建模为三个智能体,设计相应的马尔科夫过程,利用智能体交替训练学习求解,本发明的优化目标在于降低系统的时延及能耗加权和,与现有技术相比,解决了传统深度强化学习算法因探索动作空间维度长陷入局部最优解的问题,实现了在动态计算任务卸载环境中的快速卸载决策,从而提升用户体验。
技术关键词
交替迭代优化
卸载方法
终端设备
卸载策略
网络
无人机资源分配
深度强化学习技术
深度强化学习算法
资源分配策略
决策
参数
服务器节点
联网设备
协作式
变量
时延
系统为您推荐了相关专利信息
侧信道分析方法
密钥
卷积神经网络模型
深度学习模型
相关性功耗分析
可见光图像
红外光
卷积神经网络提取
像素
光强度
萤火虫算法优化
网络物流
灰色系统模型
灰色关联分析方法
注意力机制
辅助决策方法
拓扑图
辅助决策装置
深度优先搜索
网络