摘要
本发明公开了一种基于高维状态自适应DQN算法的AUV三维动态路径规划方法,属于机器人路径规划领域,该方法包括以下步骤:获取环境传感器数据,基于环境传感器数据构建工作环境三维模型;构建深度Q网络模型,将工作环境三维模型输入深度Q网络模型得到动作Q值;基于动作Q值,采用ε‑贪心策略选择动作并执行,将交互数据存入经验回放缓冲区;从经验回放缓冲区采样数据,通过贝尔曼方程计算目标Q值并优化网络参数;基于优化后的深度Q网络模型选择最大Q值动作,生成AUV的三维动态路径。本发明显著提高了AUV路径规划的成功率和路径优化程度,为水下自主航行器的路径规划提供了一种高效、智能的解决方案。
技术关键词
动态路径规划方法
DQN算法
深度Q网络
环境传感器数据
优化网络参数
三维模型
贪心策略
机器人路径规划
水下自主航行
误差
标志
方程
网格
中间层
障碍物
样本
非线性