一种基于深度强化学习的路径规划奖励函数的设计方法

AITNT
正文
推荐专利
一种基于深度强化学习的路径规划奖励函数的设计方法
申请号:CN202411662518
申请日期:2024-11-20
公开号:CN119575965B
公开日期:2025-07-29
类型:发明专利
摘要
本发明提供一种基于深度强化学习的路径规划奖励函数的设计方法,涉及路径规划技术领域。首先,计算智能体当前行驶速度与期望速度的欧氏距离,定义奖励公式,将奖励公式得到的计算结果作为奖励值赋予智能体;将障碍物分成动态障碍物和静态障碍物两类,计算两类碰撞障碍物时对智能体产生的速度障碍;计算智能体面对两种类型碰撞障碍物时最低逃脱速度障碍的成本值,并将成本值取负数作为奖励值来影响智能体的避碰行为;使用重要性因子对智能体面对动态障碍物时的最低逃脱速度障碍的成本值进行加权,得到加权后的成本;根据最安全的速度调整方向与智能体当前行驶速度的叉积、碰撞惩罚以及到达目标点奖励引导智能体学习避碰策略。
技术关键词
动态障碍物 深度强化学习 静态障碍物 速度 路径规划技术 判断障碍物 因子 定义 直线 坐标 动态地 策略 终点 圆心 场景 代表 算法 关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号