摘要
本申请实施例提供的一种车辆编队通信资源分配方法、装置及电子设备,确定当前智能体的状态信息;将状态信息输入策略Actor网络,以使Actor网络输出对应的资源分配动作;基于资源分配动作的执行结果确定当前通信网络下各个智能体在多个评估维度下的局部奖励;基于各个智能体在多个评估维度下的局部奖励确定当前智能体在对应的每个评估维度下的全局奖励;基于当前智能体在各评估维度下的全局奖励优化对应的Actor网络。通过当前通信网络下所有智能体的局部奖励确定全局奖励,进而优化Actor网络,可使得Actor网络在进行资源分配时能做出群体层面的最优选择,达到每个智能体的对应指标最优,最终实现所有智能体达到全局合作最优和局部奖励最优。
技术关键词
通信资源分配方法
通信网络
信道状态信息
智能驾驶车辆
可读存储介质
电子设备
参数
计算机程序指令
存储计算机程序
策略
网络部署
模块
处理器
注意力