摘要
本发明公开了一种密集城市下无人机航迹规划方法、装置和设备,包括:设计四旋翼无人机所处环境的动作空间和奖励函数;根据动作空间参数及奖励函数,建立三维四旋翼无人机能耗模型和基于经验回放机制的深度强化学习网络模型;采用所建立的无人机能耗模型和深度强化学习网络,进行无人机的避障训练,采用线性软更新策略实现神经网络参数的平滑更新,同时采用集优机制,在迭代次数进行到一半时,利用最新的成功训练成果更新神经网络参数,保证神经网络参数的稳定性;最后依据训练后的深度强化学习模型,该模型根据当前无人机所处状态输出无人机的下一动作,无人机执行该动作并得到下一时刻的状态,重复上述步骤,进行无人机的航迹规划,直至到达目标点。本发明提出的方法可以提高训练的稳定性和收敛性,增强无人机的自主性和稳定性。
技术关键词
深度强化学习模型
神经网络参数
四旋翼无人机
无人机航迹规划
机制
引导无人机
能耗
存储计算机程序
网络优化
策略
能量消耗
线性
输出模块
系统为您推荐了相关专利信息
鲸鱼算法
混合优化算法
计算成本函数
位置更新
多设备
图像增强模型
金字塔池化模块
积层
建立检测方法
晶体
关联分析方法
多维特征向量
双向长短期记忆网络
学生
多学科
情感分析方法
矩阵
条件随机场
注意力机制
交互注意力
健康监测方法
基金
双通道神经网络
长短期记忆网络
指数