摘要
本申请实施例提供了一种车辆资源配送的控制方法和装置、存储介质和电子设备,其中,该方法包括:基于目标区域当前的区域采集数据,生成当前环境状态特征,并将当前环境状态特征转换为当前环境状态;将当前环境状态输入到当前策略网络,得到当前策略网络输出的初始配送路径,其中,当前策略网络用于表示在环境状态下,采用动作空间中的不同动作的概率,动作空间中的一个动作是指配送车辆选择一组节点中对应的节点进行资源配送;对初始配送路径循环执行破坏操作和修复操作,直到满足循环结束条件,得到目标配送路径,并控制配送车辆按照目标配送路径执行资源配送任务。通过本申请,可以解决相关技术中的路径规划方法存在的路径质量低的问题。
技术关键词
策略
节点
网络
卫星遥感数据
车辆
资源
路径规划方法
网格
电子设备
可读存储介质
传感器
处理器
地面
参数
存储器
计算机
序列
决策
种子
系统为您推荐了相关专利信息
资源调度系统
服务终端
医疗场景
多模态传感器
医院
公交站点
公共交通线网优化方法
出行方式
旅客
行程
人车交互系统
虚拟键盘
车辆解闭锁
传感器
车辆多媒体系统
计算机可读指令
节点
计算机设备
样本
大语言模型