摘要
本发明提供了基于深度强化学习的表型巡检机器人垄行跟踪导航方法及系统,属于农业机器人自主导航领域。为了解决现有农业机器人的导航方法在前期需要进行大量数据采集,受光照影响大,存在灵活性差、可用性差的问题。本发明构建了感知信息处理模块、状态升维模块和运动决策模块,以深度图像作为输入,直接以机器人动作作为输出,无中间输出变量,引用设计的奖励函数来强调对于任务目标更为关键的特征,并抑制那些相对不重要的特征。本发明实现了灵活性强、无需准备大量前期工作、受光照条件影响小、具备24h导航能力的沿垄行跟踪导航方法。
技术关键词
巡检机器人
跟踪导航方法
深度强化学习
直方图均衡化
信息处理模块
通道注意力机制
代表
农业机器人
仿真环境
深度图像预处理
多维图像数据
Sigmoid函数
图像缩放
连续动作空间
深度卷积神经网络
视觉特征信息
深度图像数据
运动状态信息