摘要
一种基于拥塞避免和震荡解除机制的多智能体路径规划方法,多智能体局部环境信息的采集和处理;根据动态环境构建拥塞信息;构建深度神经网络提取可观测环境特征;通过选择通信机制使局部范围内的智能体进行有效信息交互,推动多智能体协作任务完成;基于D3QN方式对网络模型进行训练,并引入优先经验回放和课程学习,提高方法学习效率和稳定性;根据近7步位移信息判断智能体是否陷入震荡,并用搜索算法解除震荡,提高算法成功率。本发明有效减少运行过程中拥塞情况的发生,缓解了大规模任务中智能体陷入震荡的情况,使得本发明随着任务规模的扩大仍保持着良好的求解效果,且有较好的实用价值。
技术关键词
拥塞信息
信息编码器
邻居
障碍物
注意力机制
构建深度神经网络
多层感知机
路径规划决策
多智能体协作
搜索算法
强化学习策略
时序依赖关系
参数