摘要
本发明提供一种基于时序状态感知的深度强化学习车辆边缘计算卸载方法及相关设备。该方法通过将LSTM网络嵌套在DDPG网络的actor网络和critic网络的前馈神经网络中,构建得到深度强化学习网络;接着定义深度强化学习网络的状态空间、动作空间和奖励函数,进而使用经验缓冲区中的样本数据对深度强化学习网络进行训练,得到车辆边缘计算卸载模型。其中,在定义状态空间时,根据车辆属性和任务大小对车辆赋予了优先级数值,解决了在车辆边缘环境中面临的时延敏感性问题;而通过使用LSTM网络分析车辆的历史状态和当前状态,捕获历史状态和当前状态之间的时间依赖关系,实现对车辆状态变化的感知,提高动作预测的准确性,更好地预测动作,降低系统成本。
技术关键词
深度强化学习
卸载方法
车辆
前馈神经网络
时序
空间模块
非暂态计算机可读存储介质
定义
时延
布尔型变量
队列
资源分配
样本
服务器
坐标
卸载系统
数值
网络分析
系统为您推荐了相关专利信息
行政区划数据
高精地图数据
网约车出行
区域管理方法
动态
状态检测方法
路段
序列
计算机可读指令
特征编码模型
决策树模型
诊断方法
故障预测模型
案例知识库
车辆
智能车位管理系统
管理终端
摄像头模块
智能车位管理方法
图像分析