摘要
本发明公开了剩余寿命不确定下的飞机强化学习预测性维修决策方法,其中该方法包括:依据飞行任务序列数据生成训练集和测试集;分别构建第一值分布强化学习模型和第二值分布强化学习模型;从训练集中选取飞行任务序列输入第一值分布强化学习模型中,生成飞机维修决策;基于第二值分布强化学习模型,计算飞机维修决策对应的长期收益;依据长期收益和第二值分布强化学习模型,更新第一值分布强化学习模型的网络参数;待更新后的第一值分布强化学习模型训练完成后,通过训练得到的第一值分布强化学习模型预测飞机维修决策,能够提升所确定的飞机维修决策的可靠性。
技术关键词
强化学习模型
飞机
决策
子模块
序列
通信接口
寿命
存储器
网络
参数
处理器
偏差
误差
电子设备
数据
程序