摘要
本发明公开了一种基于深度强化学习的机器人动态环境自主导航方法,包括:设定移动机器人的观察空间和动作空间;获取环境数据并进行预处理,对激光雷达以及深度相机数据进行特征提取,生成移动机器人观察空间特征图;获取机器人的目标位置,使用A*算法生成从当前位置到全局目标的路径,根据当前位置以及全局路径生成子目标点;构建PPO深度强化学习网络,将观察空间特征图和子目标点作为网络的输入,输出得到移动机器人的状态价值、前进速度和转向速度实现自主导航;设计奖励函数,建立仿真环境,基于奖励函数训练深度强化学习网络用于实时的复杂动态环境下的自主导航。实现了移动机器人在保持前进的同时主动避免与行人及障碍物的碰撞。
技术关键词
移动机器人
深度强化学习
特征提取网络
自主导航方法
深度相机数据
仿真环境
线段
运动学特征
速度
瓶颈
激光雷达传感器
激光雷达数据
动态
障碍物
注意力
策略
网格地图
系统为您推荐了相关专利信息
矿浆输送管
网优化方法
优化调度模型
深度强化学习
高压隔膜泵
系统上下文
深度强化学习模型
资源分配
序列
列表
样本
浮点型数据
损失函数设计
深度学习模型
选育模块