摘要
本发明提供基于知识引导深度强化学习的旅行商问题求解方法及装置,该方法用于求解无人机的待监测地路径规划问题,包括:获取训练样本集和测试样本集;向深度强化学习模型输入训练样本集,并将训练样本分别创建为无向完全图;基于所述训练无向图集,利用滑动平均值算法,确定模型的当前决策能力;结合模型的当前决策能力和理论边界,得到自适应基线;通过所述自适应基线,确定RIDGE算法,得到训练后的深度强化学习模型;以及利用测试样本集测试深度强化学习模型。通过本公开的方案,解决了无人机的待监测地路径规划问题中环境一致性假设与尺度泛化能力需求之间的矛盾。
技术关键词
深度强化学习模型
滑动平均值算法
基线
训练样本集
无人机
路径规划方法
路径规划装置
监测点
求解装置
决策
理论
滑动窗口
基准
模块
系统为您推荐了相关专利信息
基准特征
多维度评估模型
多维度特征提取
时序特征
财务系统
单木树冠
点云提取方法
顶点
实例分割
语义分割网络
高速公路突发事故
事故现场
无线信号收发器
激光测距仪
控制箱
室外变电站
三维激光扫描设备
计算方法
三维点云数据
电气设备