摘要
本发明公开了一种基于专家示范引导的机器人自主探索方法,该方法包括:对机器人探索在马尔科夫决策框架下建模为序贯决策问题,其中动作空间离散化为运动基元,将待探索环境表示为栅格图,通过历史行为信息和不同尺度的地图构建状态空间;在具备完整环境结构的探索任务中求解最短路径规划问题,得到专家示范;使用近端策略优化的目标函数,将专家演示作为机器人在真实环境中采取的行动,利用专家演示操作和智能体经验进行策略优化;使用更新后的策略实现机器人在未知环境中的探索。本发明利用环境的特权化结构信息,将专家示范与机器人自身的经验相结合,降本增效还加快了收敛速度。
技术关键词
多边形
求解算法
策略
障碍物
后机器人
决策
采样点
全局地图
栅格
基元
列表
规划
框架
处理器
两阶段
代表
超参数
系统为您推荐了相关专利信息
视觉系统
动态路径规划
纸箱
匹配模块
三维点云数据
深度强化学习
SAC算法
规划系统
决策规划方法
车辆
语义变化检测方法
变化检测网络
网络结构
语义特征
影像
合流控制方法
交通环境感知
车道
深度Q网络
交通流状态