摘要
本发明公开了一种基于深度强化学习模型的卫星边缘计算卸载方法、系统及电子设备,方法包括以下步骤:步骤一、深度强化学习模型收集当前卫星网络状态,获得环境返回的奖励和下一时刻状态;步骤二、以经验元组的形式存储深度强化学习模型与环境的步骤一交互过程所获得的信息;步骤三、随机抽样步骤二的经验元组,用于训练深度强化学习模型中的卸载决策策略;训练过程,不断调整深度强化学习模型的神经网络权值,直到卸载决策策略收敛;步骤四、深度强化学习模型根据卸载决策策略结合当前卫星网络环境和任务需求做出最优卸载决策。本发明具有优化卫星网络计算卸载决策的有益效果。
技术关键词
深度强化学习模型
卫星网络环境
神经网络权值
决策
策略
卸载方法
深度神经网络
李雅普诺夫优化
电子设备
卸载系统
噪声方差
队列
随机噪声
处理器
时延
参数
存储模块
系统为您推荐了相关专利信息
三维温度场
径向基函数插值算法
重构方法
电解槽
热扩散效应
智能分配方法
建筑
需求预测模型
时间序列特征
矩阵