摘要
本发明公开了一种多智能体分布式路径搜寻方法、系统和计算机设备,首先通过传感器获取每个智能体的周边小范围环境信息;利用启发式搜索实现对于路径的规划,在栅格地图中计算静态成本(基于栅格地图拓扑结构)与动态成本(基于单个智能体的可更新观测值),并选择成本低的路径;使用神经网络实现策略生成,且不设置奖励参数与额外的规划即可进行有效训练,有效提升该方法应用的普遍性,且运用分布式方法控制单个智能体,即单个智能体的行动选择规划是不同的;最终经过动作解码后输出单个单个智能体的动作分布,从而实现避障动作的生成。克服了传统方法寻找一组无冲突路径较为低效的问题,且具有更好的泛化能力和更优的鲁棒性。
技术关键词
栅格地图
路径搜寻方法
网格
路径规划算法
神经网络训练
动态
生成动作
计算机设备
策略更新
路径规划器
分布式方法
门控循环单元
启发式搜索
搜寻系统
模块
解码
传感器