摘要
本发明涉及车辆系统资源管理技术领域,具体的说是一种利用参数化深度强化学习来解决实时卸载决策问题,以最小化系统的长期延迟、能耗和成本的基于P‑DQN的车辆边缘计算系统资源管理方法,其特征在于,构建一个包含本地、边缘服务器和云层的三层任务卸载系统;构建了一个联合考虑延迟、能耗和成本的优化问题,并将问题框架化为马尔可夫决策过程MDP,设计了状态空间和奖励函数,并引入了一个参数化的行为空间,有效管理混合行为空间;此外,提出基于参数化Q网络P‑DQN的方法来解决优化问题。
技术关键词
系统资源管理方法
车辆
云服务器
决策
最小化系统
节点
能耗
概率密度函数
卸载系统
资源分配
卸载策略
网络
路边单元
定义
深度强化学习算法
参数
时间段
瑞利衰落信道