摘要
基于深度强化学习的移动机器人自主探索导航方法,主要由数据输入模块、候选动作点评选模块、候选目标点评选模块构成。通过数据输入模块把移动机器人的占用地图、移动机器人的位置数据信息、传感器所探测的周围环境数据信息传入下一个模块。候选动作点评选模块中基于香农熵进行地图的构建,通过高斯过程回归模型预测现有占用地图的互信息奖励曲面,利用贝叶斯优化技术改进高斯过程回归的预测结果,然后用基于学习的感知策略去评选出候选动作点。通过训练感知网络模型。最终从多个候选动作点选出最优的候选目标点。最后移动机器人导航模块根据候选目标点规划出运动路径,并驱动移动机器人向目标点进行探索。
技术关键词
深度强化学习
导航方法
SLAM算法
数据输入模块
周围环境数据
驱动移动机器人
观测周围环境
移动机器人导航
表达式
高斯噪声方差
仿真场景
周围环境地图
融合激光雷达
SLAM技术
路径搜索算法
采样点
系统为您推荐了相关专利信息
个性化学习路径
知识点
推荐系统
知识图谱构建
序列推荐
地图导航方法
动态窗口法
动作选择器
激光雷达数据
贪心策略
自动驾驶系统
智能网联汽车
智能底盘
动力总成
智能座舱
语音导航方法
文本
规划行驶路径
人机交互终端
多轮语音交互