摘要
本发明涉及一种基于多智能体强化学习的车联网频谱共享与MCS调度方法,包括:构建并集中式训练多智能体强化学习模型;将训练好的多智能体强化学习模型分布式部署在每个V2V用户中;V2V用户在道路上行驶时,将自身感知到的信道状态信息以及消息发送的相关信息传入训练好的多智能体强化学习模型,训练好的多智能体强化学习模型输出一个向量,向量中每个元素大小表示对应动作获得最大奖励值的概率,选择概率最大的动作,以此获得最佳的频谱子带、发射功率以及MCS的选择方案。本发明同时优化了V2V链路频谱子带的选择、发射功率的选择以及MCS的选择,并在满足V2V链路不同业务类型传输可靠性的同时,最大化V2I链路的平均和速率。
技术关键词
多智能体强化学习
链路
频谱共享
车联网系统
强化学习模型
信道状态信息
可靠性计算方法
更新网络参数
接收端
定义
发送消息
随机梯度下降
深度神经网络
贪婪策略
消息传输
噪声功率
系统为您推荐了相关专利信息
强化学习算法
云服务器
化学反应优化算法
卸载策略
网络
数据分区方法
强化学习模型
序列
信息采集模块
语句