摘要
本发明属于强化学习、飞行器姿态控制技术领域,具体涉及基于可解释强化学习的飞行器姿态控制方法,首先,设计了一种具有强鲁棒性的飞行器姿态控制器,通过引入多通道控制网络并结合强化学习算法,控制器能够有效应对外界干扰和系统非线性带来的挑战,显著提高了飞行器控制系统的适应性和鲁棒性。其次,本发明提出了一种结合可视化分析的可解释性方法。通过使用t‑SNE算法对飞行器控制系统输入特征进行降维可视化,并结合SHAP值对输入特征进行归因分析,能够揭示模型决策过程中的关键因素,帮助理解飞行器控制系统如何根据不同输入特征做出决策。本发明实现了飞行器控制系统在复杂环境中的高适应性和透明度。
技术关键词
飞行器控制系统
SAC算法
策略
神经网络控制器
飞行器姿态控制器
马尔科夫模型
高维特征向量
定义
飞行器稳定
学习控制器
更新网络参数
决策
姿态角速度