摘要
本发明涉及一种基于多轮随机搜索策略的分布式强化学习车联网资源分配方法,属于车联网无线通信技术领域,以解决现有技术中车联网资源分配动作空间复杂度高、资源分配优化不理想,无法保证V2V链路中安全数据成功传输率以及最大化V2I链路吞吐量的问题。本发明构建功率与信道分配神经网络,生成全局方案计算奖励,用多轮随机搜索优化经验池,训练网络,最后测试评估,提升资源分配效率与网络性能。本发明简化车联网资源分配动作空间,降低求解难度,通过多轮随机搜索加快算法收敛,用交叉熵损失训练提升信道分配性能,保障V2V链路安全数据传输,最大化V2I链路吞吐量,改善车联网运行效率与用户体验。
技术关键词
分布式强化学习
环境状态信息
信道
发射机
全局资源分配
分布式训练
链路吞吐量
策略
网络
车联网无线通信技术
车联网资源分配
数据传输成功率
监督学习算法
通信链路
接收机