摘要
本发明属于自主机器人轨迹规划与决策领域,并具体公开了一种基于序列预测与动态掩膜的机器人动态避障方法及系统,其包括:对动态避障问题本身进行MDP建模并搭建仿真环境;设计基于改进长短时记忆网络的传感器数据预测方法,通过对当前与过去一段时间的传感器数据输入,预测下一段时间的传感器数据;基于空间注意力网络设计传感器动态数据掩膜,并将掩膜数据与原始数据进行数据融合,对传感器数据进行扩充;设计策略函数和奖励函数,基于仿真环境对决策网络进行训练。通过强化学习算法的集成,能够不断优化避障策略,提高机器人在复杂环境中的导航和避障能力。
技术关键词
动态避障方法
动态掩膜
障碍物
决策
仿真环境
机器人传感器
序列
掩膜数据
空间注意力网络
动态避障系统
数据池化层
数据预测方法
自主机器人
强化学习算法