摘要
本申请公开了一种基于分层强化学习的自动着陆控制方法、设备及介质,涉及无人机技术领域,方法包括:利用专家经验赋权器对环境参数和飞行器状态参数赋加注意力权重,得到赋权后的环境参数和飞行器状态参数;根据赋权后的环境参数、赋权后的飞行器状态参数和决策记忆,利用上层强化学习网络进行着陆决策,得到决策结果,并根据决策结果更新决策记忆;根据决策结果,利用赋权后的环境参数和赋权后的飞行器状态参数,通过下层强化学习网络对飞行器进行飞行控制,完成着陆。本申请通过上层强化学习网络对飞行器进行着陆决策,通过下层强化学习网络对飞行器进行自适应控制,引导飞行器自动着陆,提高了飞行器自动着陆过程的适应性和鲁棒性。
技术关键词
强化学习网络
着陆控制方法
分层强化学习
模拟飞行器
决策
记忆
仿真平台
注意力
着陆跑道
神经网络模型
无人机技术
处理器
计算机设备
参数
可读存储介质
存储器
鲁棒性