摘要
本发明公开了一种基于非参数强化学习的航空发动机维护策略优化方法。首先,针对稀疏航空发动机运行数据,通过贝叶斯网络与高斯过程建立航空发动机模型;然后,建立策略网络和价值网络,与航空发动机模型交互,形成状态动作价值组,存入重放缓冲区,随机采样,作为训练集;更新策略网络和价值网络,更新训练集;最后进行航空发动机维护优化策略决策。本发明首次提出针对航空发动机基于高斯过程的非参数强化学习方法,在融合系统不确定性的同时,通过动态数据更新提高整体训练数据与模型的拟合程度,提高算法采样效率;基于先验维护经验数据融合不确定性进行动作选择,提高系统的安全性与采样效率,进而解决航空发动机系统的预测性维护问题。
技术关键词
航空发动机模型
状态转移模型
网络
策略优化方法
期望最大化算法
贪婪算法
训练集
贝叶斯数据融合
优化策略决策
航空发动机系统
缓冲模块
协方差矩阵
动态更新
强化学习方法
参数
历史运行数据
模型训练模块
系统为您推荐了相关专利信息
故障场景
深度神经网络
电力系统仿真软件
生成方法
时间卷积网络
残差神经网络
多层感知机
机器人基坐标系
补偿方法
机器人运动学模型
接触垫片
射频探针
触板
矢量网络分析仪
全自动调控系统
脑电信号分类
机械臂控制方法
运动想象脑电信号
视频流
控制模块