摘要
本发明提供一种基于深度强化学习的无人机动态航迹规划算法,包括:利用网格划分对无人机的路径规划环境进行建模,获得地图环境模型;根据地图环境模型设计无人机的状态空间;设计无人机路径规划的奖励函数;根据无人机状态空间和奖励函数,结合改进的深度强化学习算法进行无人机动态航迹规划,得到无人机的最优路径规划结果。本发明通过显著抑制深度Q网络(DQN)的过估计问题,提升航迹规划精度,且能够适应复杂动态环境,增强无人机任务适应性,提供可解释性强的决策支持,并提升任务执行效率。
技术关键词
动态航迹
深度强化学习算法
规划算法
设计无人机
信息熵
正则化参数
概率密度函数
节点
地图
网格
终点
深度Q网络
航迹规划
表达式
路程
能量消耗