摘要
本发明涉及人工智能技术领域,尤其涉及一种氢燃料电池多变量协调容错控制的深度强化学习方法,包括实时获取氢气流量、占空比、电压误差及温度、气体分压等状态信息;接着构建基学习器的动作与状态空间,并设计包含控制误差惩罚和燃料利用率约束的奖励函数;然后利用强化学习算法训练基学习器,生成初始策略网络;再基于温度和气体分压构建元学习器状态空间,通过评估和训练初始策略网络得到目标策略网络;最后应用其目标策略网络对燃料电池系统进行实时控制。本发明可有效协调多变量并具备容错能力,提升系统性能与稳定性。
技术关键词
深度强化学习方法
控制误差
容错控制
策略
氢气
强化学习算法
直流转换器
电压
氢燃料电池
变量
网络
燃料电池系统
学习器
参数
氧气
轨迹
人工智能技术
更新方法
系统为您推荐了相关专利信息
超声图像数据
Laplacian算子
补丁
模块
因子