摘要
本发明公开了城市超低空无人机的地理围栏实时规避方法,具体为:步骤1:构建并初始化仿真环境,并在无人机起飞后在无人机的参考轨迹上随机生成若干个突发地理围栏;步骤2:设置深度强化学习模型,当经验池中累积的数据量达到阈值后,在经验池中进行采样,基于采样的样本对深度强化学习模型的策略网络与价值网络的参数进行更新;步骤3当策略网络与价值网络参数更新的次数达到预设的阈值后:对目标策略网络和目标价值网络的参数进行软更新;步骤4:使用训练好的深度强化学习模型,对无人机飞行时进行实时决策。
技术关键词
超低空无人机
深度强化学习模型
规避方法
网络
编码器
策略
拼接模块
门控循环单元
仿真环境
参数
归一化模块
多层感知器
动态地理围栏
多层感知机
状态转移模型
表达式
引导无人机
系统为您推荐了相关专利信息
数据处理方法
图谱
机器学习算法
表达式
深度神经网络
网络配置参数
网络节点
异质
网络拓扑
配置检测方法
降水预报方法
地形特征
动态卷积网络
前馈神经网络
数据
分布式多智能体
时空特征信息
强化学习模型
网络状态信息
时序结构
网络药理学
计算机辅助药物设计
评估候选化合物
核心
肝癌