摘要
本发明涉及路径规划技术领域,提供了一种基于深度强化学习的路径探索参数优化系统,包括:可变参数路径规划模块,用于基于深度强化学习网络进行节点探索,对子节点集合中的子节点进行碰撞检测以及计算所有的子节点的代价值,最后通过Reeds‑Shepp曲线生成装载泊入路径;环境状态空间建模模块,用于对当前节点的周围障碍物进行区域划分,以及进行环境状态空间建模;深度学习参数优化模块,用于构建深度学习网络计算出最优步长和最优转向角,并构建奖励函数对深度学习网络进行优化,同时执行深度学习网络的训练流程。实现通过深度强化学习网络优化路径规划方法中的探索参数以及通过分析环境中的障碍物信息,建立考虑障碍物分布的状态空间。
技术关键词
深度强化学习
参数优化系统
转向角
节点
构建深度学习网络
DQN算法
矿车
终点
曲线
模块
路径规划技术
参数优化方法
路径规划方法
平滑度
判断障碍物
系统为您推荐了相关专利信息
软件漏洞检测方法
程序依赖图
软件漏洞检测系统
数据
邻域
加密数据
追溯方法
时序
长短期记忆神经网络
身份