摘要
本发明提供一种面向不同密度障碍区域的分体式飞行车辆学习规划方法,属于飞行器规划技术领域。包括:Step1、障碍区域划分,分为密集障碍物区域和稀疏障碍物区域;Step2、动作空间优化;面向不同密度障碍区域,采取不同的动作空间;Step3、任务路径规划;飞行车辆采取不同动作空间与环境进行高效交互,获得能够最大化累积奖励的动作序列,即最优动作序列,最终以更高的学习效率,规划出一条较短的空地协同任务路径。本发明引入障碍密度阈值的概念,尤其面向稀疏障碍区域,飞行车辆主要保留朝向目标位置方向的动作,剔除其余冗余动作,有效减少了动作空间维度。从而显著提高了学习效率。
技术关键词
学习规划方法
障碍物
车辆
密度
空地协同
地面
轮盘赌算法
冗余动作
序列
栅格
地图
飞行器
机制
偏差
定义
概念
信号
因子