基于强化学习的双时间尺度多智能体系统控制方法及系统

正文

推荐专利

申请号：CN202411915207

申请日期：2024-12-24

公开号：CN119717537A

公开日期：2025-03-28

类型：发明专利

摘要

本发明涉及多智能体系统技术领域，提供了基于强化学习的双时间尺度多智能体系统控制方法及系统，包括：基于通讯拓扑图，建立智能体之间的跟踪误差，求导得出跟踪误差的动态信息后，合并带有控制输入的恶意攻击，采用积分滑模控制器对耦合项进行抵消，得到跟踪误差动力学模型，采用H∞控制方法，转换为智能体间的零和博弈问题后，定义与性能指标相关哈密顿函数，将哈密顿函数求偏导，得出跟踪策略，并将跟踪策略带入李雅普诺夫方程，得出跟踪误差的博弈代数黎卡提方程，进行拆分后，使用积分强化学习算法，通过策略迭代方式，计算得到多智能体系统最优的反馈增益。实现了在保证多智能体系统的最优一致性的同时消除恶意攻击。

技术关键词

多智能体系统控制积分滑模误差强化学习算法邻居系统控制参数拓扑图双时间尺度方程控制策略可读存储介质控制系统控制器通讯动态处理器计算机

系统为您推荐了相关专利信息

一种用于SAR ADC的数字校准方法

数字校准方法电容失配误差电容阵列数模转换数字码

一种计及误差修正的多极端天气场景下负荷预测方法

负荷预测方法天气综合评价指标皮尔逊相关系数误差修正模型

基于人工鱼群优化的小波神经网络预测光伏并网网损方法

人工鱼群优化人工鱼群算法小波神经网络光伏发电功率数据

一种石墨化炉的温度均匀性优化处理系统

二维温度场温度监测模块红外热像仪强化学习算法护板

一种地源热泵中央空调实时动态精准调控方法及系统

地源热泵中央空调变化趋势预测温湿度精准调控系统智能调控

基于强化学习的双时间尺度多智能体系统控制方法及系统

站点导航

APP 下载