一种基于深度强化学习的路径规划奖励函数的设计方法

正文

推荐专利

申请号：CN202411662518

申请日期：2024-11-20

公开号：CN119575965B

公开日期：2025-07-29

类型：发明专利

摘要

本发明提供一种基于深度强化学习的路径规划奖励函数的设计方法，涉及路径规划技术领域。首先，计算智能体当前行驶速度与期望速度的欧氏距离，定义奖励公式，将奖励公式得到的计算结果作为奖励值赋予智能体；将障碍物分成动态障碍物和静态障碍物两类，计算两类碰撞障碍物时对智能体产生的速度障碍；计算智能体面对两种类型碰撞障碍物时最低逃脱速度障碍的成本值，并将成本值取负数作为奖励值来影响智能体的避碰行为；使用重要性因子对智能体面对动态障碍物时的最低逃脱速度障碍的成本值进行加权，得到加权后的成本；根据最安全的速度调整方向与智能体当前行驶速度的叉积、碰撞惩罚以及到达目标点奖励引导智能体学习避碰策略。

技术关键词

动态障碍物深度强化学习静态障碍物速度路径规划技术判断障碍物因子定义直线坐标动态地策略终点圆心场景代表算法关系

一种基于深度强化学习的路径规划奖励函数的设计方法

站点导航

APP 下载