基于改进A*启发式的多智能体深度强化学习路径规划方法

正文

推荐专利

申请号：CN202410890388

申请日期：2024-07-04

公开号：CN118759846B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了基于改进A*启发式的多智能体深度强化学习路径规划方法，属于通信技术领域，该方法首先利用Q‑Learning算法的启发式搜索能力生成先验知识，以加速MADQN算法的训练过程；并结合先验Q值和估计Q值，优化系统整体的Q值函数、设计新的动作选择策略和多目标奖励函数，改进了无人机的动态决策过程，通过综合考虑探索奖励、障碍物规避奖励和多智能体协作奖励，显著提升了智能体在复杂环境中的学习效率和任务执行效果。本发明算法在多智能体路径规划任务中，与传统算法相比，在收敛速度、任务成功率和路径规划效率方面表现出色，进一步证明了其在复杂环境中的高效性和鲁棒性。

技术关键词

路径规划方法深度强化学习无人机障碍物表达式多智能体协作路径规划效率算法启发式搜索深度神经网络动态策略坐标决策鲁棒性参数阶段定义风险

系统为您推荐了相关专利信息

一种农机多地形行进方法

加速度多地形递归神经网络序列阻力

一种互联微电网的分布式优化调度方法、系统、设备及介质

分布式优化调度方法互联微电网储能装置充放电容量发电燃料

一种血栓栓塞发生风险的评估方法及评估系统

风险评估模型栓塞样本影像高风险

一种基于改进鱼优化算法的路径规划方法

路径规划方法算法果园环境果园机器人障碍物

一种未知环境下移动机器人动态感知路径规划方法

路径规划方法动态障碍物地图更新复杂度轮廓

基于改进A*启发式的多智能体深度强化学习路径规划方法

站点导航

APP 下载