摘要
本发明提供了一种基于优势策略的车联网资源分配联合优化方法,包括:首先将资源分配问题建模为基于连续动作空间的多智能体深度强化学习问题,通过构建一个高速动态的车联网环境模型,以最大化车到基础设施通信链路的总吞吐量和保障车辆间通信链路的高可靠传输为优化目标,利用改进的MADDPG‑A2C算法进行系统性能优化。结果显示,与传统的资源分配方法相比,算法在吞吐量、延迟以及频谱利用率等关键性能指标上均表现出一定的提升。同时相较于MADDPG算法来说,改进的算法具有稳定性强、样本效率高、适用性广泛的特点。
技术关键词
通信链路
资源分配联合优化方法
网络
车辆
信道
表达式
算法
车联网环境
深度强化学习
连续动作空间
超参数
定义
资源分配方法
车联网系统
并行策略