摘要
本发明公开了一种基于图形搜索训练的Q‑learning路径规划方法,包括:使用图形搜索方法在环境地图中找到路径并根据所述路径,创建第一Reward矩阵;初始化Q矩阵并使用所述第一Reward矩阵预训练所述Q矩阵第一预设次数;根据环境地图创建第二Reward矩阵并使用所述第二Reward矩阵继续训练所述Q矩阵第二预设次数;使用所述Q矩阵寻找路径并判断寻找到的路径质量是否为最优路径,若是,则结束路径规划,若否,则返回使用所述第二Reward矩阵重新训练所述Q矩阵。本发明的一种基于图形搜索训练的Q‑learning路径规划方法,能够无需对标准算法进行修改,并且能够减少训练所需的时间,从而减少路径规划的总时间。
技术关键词
路径规划方法
矩阵
搜索方法
地图创建
广度优先搜索算法
深度优先搜索算法
单源最短路径
启发式搜索算法
路径规划系统
图像搜索
障碍物
方程
拐角
模块
因子
代表
系统为您推荐了相关专利信息
人脸深度
情感分析模型
情感特征
人脸表情
语音特征提取
智能移动通讯终端
语义
像素
X光检测仪
激光盲孔
波束赋形矩阵
高铁通信系统
LSTM神经网络
多普勒
信道