摘要
本发明公开了无人机高速导航与避障方法、系统、终端及存储介质,涉及无人机控制技术领域。本发明中的神经网络策略可以根据无人机的观测信息,输出有效的执行动作。其训练方法为:通过复杂度随机变化的仿真环境获取无人机的仿真观测信息;通过神经网络策略采样仿真执行动作;通过马尔可夫决策模型计算下一时刻的仿真状态信息和当前时刻的及时奖励,包括路径进度奖励、安全奖励、终端奖励;根据及时奖励计算折扣奖励,并利用折扣奖励优化神经网络策略。本发明通过设置三种奖励,鼓励无人机按照航线快速前进,避免碰撞风险,更快速有效地完成任务。训练采用复杂度可随机变化的仿真环境,也有效提高了神经网络策略的泛化能力。
技术关键词
仿真环境
障碍物
策略
计算方法
无人机姿态
终端
无人机控制技术
坐标
采样无人机
复杂度
决策
优化神经网络
处理器
推力
可读存储介质
程序
指令
存储器
元素
系统为您推荐了相关专利信息
面向多数据源
数据采集方法
特征提取模型
GBDT算法
实时数据采集
信誉
网络客户端
无人机
深度确定性策略梯度
车辆
孤立森林算法
值检测方法
森林模型
多维特征向量
光伏功率预测技术
辨别方法
变电站母线
单相接地故障选线
融合终端
傅里叶算法