摘要
一种基于强化学习和可微分编程的无人机避障方法、系统、设备及介质;避障方法为:构建无人机状态矩阵s;构建任务神经网络模块,根据无人机状态矩阵s,获得无人机的期望飞行向量fexp;构建可微分安全模块,根据障碍物位置修正无人机的期望飞行向量fexp,获得无人机实际飞行方向向量ffly;以任务神经网络模块在前、可微分安全模块在后的方式,将两个模块进行组合,构建无人机避障策略网络,搭建无人机仿真飞行环境,并对无人机避障策略网络进行训练,得到可用的无人机避障策略;系统、设备及介质用于承载和实现所述方法;本发明在仿真环境中实现了无人机的安全飞行,兼具智能算法和传统避障算法的优点,从而提高无人机执行任务过程中的安全性。
技术关键词
无人机避障方法
构建无人机
障碍物
确定性策略梯度
编程
强化学习算法
模块
网络
无人机避障系统
矩阵
避障算法
超参数
可读存储介质
仿真环境
坐标
智能算法