摘要
本发明公开一种融合深度强化学习与模糊逻辑的清洁机器人避障决策方法,涉及机器人避障技术领域,包括:清洁机器人通过传感器收集周围环境信息,并将其转化为图像或点云数据;构建决策模型,决策模型自动提取图像或点云数据的数据特征,生成初步避障策略;清洁机器人借助强化学习机制,在与环境持续交互、不断试错的过程中,优化决策模型;同时,引入模糊逻辑模块,将精确传感器数据模糊化,经模糊规则推理与解模糊化操作,进一步优化决策模型;清洁机器人的传感器持续实时采集周围环境数据,输入至融合深度强化学习和模糊逻辑的决策模型,决策模型根据最新的环境信息生成避障指令。本发明可以实时调整运动控制参数,实现快速避障。
技术关键词
深度强化学习
模糊逻辑
决策方法
收集周围环境
模糊规则推理
障碍物
长短期记忆网络
控制清洁机器人
数据
构建决策模型
隶属度函数
采集周围环境
多模态卷积神经网络
机器人避障技术
视觉传感器
策略
感知周围环境