摘要
本发明提出基于深度强化学习的无人机路线规划方法,方法包括:利用基于梯度的柏林噪声和数字高程图构建三维非结构化地图;构建基于固定翼无人机的含约束的无人机自主探索的部分可观测马尔可夫决策过程模型对固定翼无人机的飞行路线进行约束;根据部分可观测马尔可夫决策过程模型构建基于深度学习的路线规划模型,并采用PPO算法对所述路线规划模型进行优化。本发明使用深度神经网络,拟合强化学习的动作价值函数、策略、模型等组成部分,构建从局部观测到值函数和策略函数的深度神经网络近似映射,建立部分可观测马尔可夫决策过程模型,完成强化学习框架搭建,提高模型在应对大规模状态空间时的鲁棒性与泛化能力。
技术关键词
柏林噪声
深度强化学习
结构化地图
固定翼无人机
切片地图
深度神经网络
连续动作空间
策略
拟合强化学习
决策
路线规划系统
频率
强化学习框架
随机噪声
模拟无人机
系统为您推荐了相关专利信息
子模块
个性化教育资源
个性化资源
知识图谱构建
深度强化学习算法
动态管控方法
共享电单车
控制模块
深度强化学习算法
卡车
早期识别方法
石油钻井工程技术
深度强化学习算法
学习历史数据
乙烷
供热智能调控系统
数字孪生
深度强化学习
供热系统
分布式传感器网络
高维特征向量
多模态传感器
混合神经网络模型
能耗
多模态数据融合