摘要
本发明公开了一种用于机器人在栅格地图中自动路径规划方法,涉及基于深度强化学习的路径导航方法。该方法包括创建抽象栅格地图,设计奖励函数以及用于导航的智能体;之后智能体感知栅格地图的状态,作为状态信息输入初始决策网络,得到初始的决策数据,然后经由一个复杂系统计算输出平均磁矩作为补充数据,按照特定方式结合初始决策数据以及补充数据得到最终的决策数据;智能体按照赢者通吃策略利用最终决策数据进行动作选择以及执行;智能体获得奖励以及最新状态信息,利用经验回放池优化决策网络,最终得到当前栅格地图中的最优行动策略。该方法能够提高智能体在栅格地图中探索和利用的平衡,从而提高智能体路径寻优的效率。
技术关键词
栅格地图
决策
数据
路径导航方法
自动路径规划
环境状态信息
策略
深度强化学习
障碍物
人工神经网络
终点
连续性
蒙特卡洛
因子
元素
动态
机器人
系统为您推荐了相关专利信息
大语言模型
问答生成方法
答案
预训练语言模型
处理器
协同运动机构
数据处理方法
数据处理装置
工业
特征识别模块
纳米磁珠
组织
隐马尔可夫模型
磁珠纯化
氨丙基三乙氧基硅烷