一种基于深度强化学习-快速探索随机树的路径规划方法

正文

推荐专利

申请号：CN202511583085

申请日期：2025-10-31

公开号：CN121028798A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于深度强化学习‑快速探索随机树的路径规划方法，包括：S1、获取起点和终点；S2、计算候选路径点，并根据Q值在动作状态中选择动作；S3、计算执行动作后的奖励值和新的动作状态；S4、将动作状态、动作、奖励值和新的动作状态储存至经验池，响应于经验池中存储数大于批次大小，则随机选择批次大小的经验值，并通过策略网络更新Q值和时序差分误差；S5、通过均方误差损失更新策略网络参数，根据时序差分误差计算目标网络更新步长；S6、判断已搜索的路径是否到达终点或满足设定的最大路径点搜索个数，若是，则输出当前路径；若否，则返回S2。本发明在提高算法搜索效率的同时，不增加算法搜索时间。

技术关键词

路径规划方法深度强化学习表达式终点误差时序矩阵策略坐标深度Q网络元素样本算法参数障碍物因子机制节点动态