摘要
本发明公开了基于深度强化学习的移动机器人路径规划方法,涉及机器人路径规划技术领域;本发明中将移动机器人路径分为全局规划和局部避障,局部避障通过BiLSTM‑D3QN模型实现;通过BiLSTM模型的决策分支分析第一传感数据得到决策参数,将决策参数与设定的参数阈值进行比较判定是否进行局部避障;在确定需要进行局部避障时,BiLSTM模型输出避障参数,再利用D3QN模型生成局部避障路径,实现移动机器人的自主避障;本发明中BiLSTM模型通过双向捕捉时序数据的上下文依赖关系,能够同时融合前向和后向的时序特征,利用多维度数据判断是否需要进行局部避障,明确局部避障的接入时机,提高局部避障的准确性和可靠性。
技术关键词
深度强化学习
BiLSTM模型
参数
障碍物
密度
避障路径
传感
决策
移动机器人路径
分支
基础
数据
感知特征
时序特征
规划
周期