摘要
本发明公开了一种无人机避障方法、装置及电子设备,该方法包括:获取环境图像信息,并基于变分自编码器对环境图像信息处理,得到环境图像信息对应的潜在状态信息;将潜在状态信息输入至目标决策模型,得到目标决策模型输出的动作决策结果,其中,目标决策模型是基于近端策略优化算法对初始决策模型训练得到;基于动作决策结果执行无人机避障。本发明的技术方案,通过数据降维的方式,可以有效去除噪声、提取图片的关键特征,从而提供更小且更优信息量的输入数据,同时采用深度神经网络,可以通过大量的训练数据学习到各种场景和飞行作业行为,确保无人机能适应动态、复杂作业场景,进而提高无人机系统作业的鲁棒性。
技术关键词
环境图像信息
决策
无人机避障方法
编码器
策略更新
信息处理
无人机避障装置
深度神经网络模型
电子设备
样本
无人机系统
算法
作业场景
处理器通信