摘要
本发明公开了一种基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统,该方法包括建立在故障与未知分布干扰下的多智能体系统状态空间模型;构建内层容错控制系统与外层鲁棒控制系统;基于Q学习算法设计内部容错控制增益;基于瓦瑟斯坦距离及零和博弈框架设计外层鲁棒控制增益和偏置项;结合邻域状态信息设计分布式一致性协议。本方法在系统模型未知、执行器存在加性时变故障、外部扰动概率分布不确定且仅凭有限样本的情况下,能够有效降低补偿故障与扰动的影响,并且在满足H无穷性能约束的同时,实现所有智能体的渐近状态同步,确保系统稳定。
技术关键词
鲁棒控制系统
容错控制系统
学习控制方法
多智能体系统
Q学习算法
数学模型
执行器
分布式一致性控制
分布式一致性协议
学习控制系统
容错控制器
状态空间模型
信号
矩阵
邻域
系统为您推荐了相关专利信息
PI控制器参数
参数估计算法
学习控制方法
扩张状态观测器
控制回路
强化学习控制方法
面向储能
多级控制结构
长短期记忆网络
预训练网络
系统故障检测方法
多智能体系统故障
系统故障检测装置
误差系统
李雅普诺夫函数
数据生命周期
数据安全控制
分阶段
多层数据安全
动态演化模型