摘要
本发明公开了一种基于CTSAC的机器人未知环境自主探索导航方法,该方法结合Transformer的强大序列感知能力与Soft Actor‑Critic深度强化学习框架,并引入了定期复习机制的课程学习、激光雷达分区优化处理、细化奖励设置;机器人的状态由激光雷达分区优化处理后的激光雷达数据和陀螺仪数据表示,同时,状态信息通过细化奖励设置后,得到相应的奖励值,并将相应的经验序列储存进经验池中,由经验池采样得到的数据供给神经网络进行训练。本发明适用于机器人在未知环境中通过传感器感知周围环境、进行路径规划以到达指定目标点或建立环境地图,用于太空探索、搜索救援、侦察等复杂任务。
技术关键词
机器人
导航方法
激光雷达数据
激光雷达信息
障碍物
表达式
深度强化学习模型
分区
分块
序列
感知周围环境
陀螺仪
周围环境信息
神经网络参数
策略
神经网络结构
强化学习算法
系统为您推荐了相关专利信息
视觉检测系统
机器人组件
载台组件
驱动部件
标定块
陪伴机器人
感应模块
输出模块
主控模块
数据传输接口
轮廓提取方法
轮廓生成方法
相机
机器人
直线轮廓