摘要
本发明公开了一种基于分层深度强化学习的空天地一体化网络任务卸载方法,包括构建空天地一体化模型,并利用训练好的强化学习模型在空天地一体化模型的状态空间中选取最优卸载动作执行任务卸载;强化学习模型采用改进的SAC算法选择任务卸载动作,并计算动作产生的熵值和动作奖励,动作奖励根据任务卸载的时延和能耗计算得到;根据熵值和动作奖励计算各个时隙的奖励期望,并通过最大化经各个时隙累积的奖励期望,输出最优动作;强化学习模块在计算奖励期望时,采用温度系数控制最大熵项的权重,并在优化的过程中对温度系数进行自适应调整本发明能够考虑任务卸载的时延和能耗利用强化学习策略实现最优的任务卸载。
技术关键词
天地一体化网络
深度强化学习
卸载方法
空天地一体化
强化学习模型
时延
分层
能耗
强化学习策略
参数
云服务器
资源
地面
节点
链路
终端
算法
模块
系统为您推荐了相关专利信息
运维管理方法
深度强化学习模型
循环神经网络模型
节点
故障预测模型
多智能体深度强化学习
调度优化方法
年龄
多任务
资源分配策略
变桨系统
数字孪生模型
全天候监测
测试方法
全息波导显示技术
智能控制方法
进化策略
校正机制
电气
深度Q网络
联网通信系统
智能车
信道
深度强化学习方法
非正交多址接入