摘要
本发明提供了一种基于多智能体强化学习的无人机集群路径规划方法及系统,所述方法将集群协同探索问题规范为部分可观测马尔可夫决策过程,定义考虑障碍物信息、目标信息和无人机信息的观测状态集S,考虑转弯角加速度和切向加速度的动作集,使得飞行过程中无人机的速度大小和转弯角连续变化,符合实际飞行需要;设计基于卷积神经网络的策略网络和值函数网络,提取探测信息的局部特征;根据所提出的基于强化学习的无人机集群路径规划与避障算法,实现无人机集群的自主避障飞行与轨迹规划。本发明能够使无人机集群在给定的时间内,只依赖于自身机载传感器信息在未知环境下快速、高效地完成物资运输、应急救援等协同任务。
技术关键词
无人机集群协同
多智能体强化学习
标志位
网络
路径规划方法
序列
策略
参数
障碍物
路径规划系统
机载传感器
决策
仿真环境
加速度
数据
系统为您推荐了相关专利信息
多尺度特征提取
图像分割方法
图像处理模块
通道注意力机制
图像捕捉装置