摘要
本发明提供一种基于蒙特卡洛树搜索的机器人导航动作决策方法及装置,涉及机器人导航技术领域。其中,方法包括:获取当前时刻的系统状态信息;其中系统状态信息包括机器人状态信息、机器人所在环境的行人状态信息和障碍物状态信息;以当前时刻的系统状态信息为根节点进行蒙特卡洛树搜索,得到构建的搜索树;其中,在搜索过程中,将叶子节点对应的系统状态信息输入至机器人策略价值模型,基于机器人策略价值模型的输出结果进行动作选择和反向传播;基于搜索树中根节点对应的动作选择次数,确定当前时刻机器人导航动作决策结果。本发明可以提升动作决策的精准性,以及机器人导航的稳定性。
技术关键词
系统状态信息
蒙特卡洛树搜索
多层感知机
交互特征
障碍物
机器人状态信息
节点
网络
决策方法
导航特征
注意力
策略
行人特征
机器人导航技术
非暂态计算机可读存储介质
边界特征
计算机程序产品
处理器
系统为您推荐了相关专利信息
障碍物
柔性可重构
Dijkstra算法
栅格
节点
胶囊内窥镜
三维卷积神经网络模型
多层感知机层
编码器模块
多头注意力机制
攻击检测方法
大语言模型
权重计算方法
门控循环单元
数据
末端执行器
线控机器人
装配系统
装配单元
智能搬运机器人