摘要
本发明涉及多智能体系统技术领域,提供了基于强化学习的双时间尺度多智能体系统控制方法及系统,包括:基于通讯拓扑图,建立智能体之间的跟踪误差,求导得出跟踪误差的动态信息后,合并带有控制输入的恶意攻击,采用积分滑模控制器对耦合项进行抵消,得到跟踪误差动力学模型,采用H∞控制方法,转换为智能体间的零和博弈问题后,定义与性能指标相关哈密顿函数,将哈密顿函数求偏导,得出跟踪策略,并将跟踪策略带入李雅普诺夫方程,得出跟踪误差的博弈代数黎卡提方程,进行拆分后,使用积分强化学习算法,通过策略迭代方式,计算得到多智能体系统最优的反馈增益。实现了在保证多智能体系统的最优一致性的同时消除恶意攻击。
技术关键词
多智能体系统控制
积分滑模
误差
强化学习算法
邻居
系统控制参数
拓扑图
双时间尺度
方程
控制策略
可读存储介质
控制系统
控制器
通讯
动态
处理器
计算机
系统为您推荐了相关专利信息
数字校准方法
电容失配误差
电容阵列
数模转换
数字码
负荷预测方法
天气
综合评价指标
皮尔逊相关系数
误差修正模型
人工鱼群优化
人工鱼群算法
小波神经网络
光伏发电功率
数据
二维温度场
温度监测模块
红外热像仪
强化学习算法
护板
地源热泵中央空调
变化趋势预测
温湿度
精准调控系统
智能调控