摘要
本发明公开了一种基于深度强化学习的多智能体事件触发控制方法及系统,该多智能体事件触发控制方法构建了智能体系统的动力学模型和一致性控制器,并在一致性控制器中引入了时变函数和指定的收敛时间,能够根据指定的收敛时间动态调整控制参数,适应复杂多变的运行环境,提升控制器的鲁棒性;在设定智能体系统中各智能体的观测、动作和奖励,并在奖励引入收敛时间惩罚项后,基于不同时刻的观测、动作和奖励构建经验存放区,并使用经验存放区对构建的深度神经网络进行训练;使用训练后的深度神经网络和ε‑贪心策略获取最优事件触发策略;根据最优事件触发策略使用一致性控制器完成对各智能体的实时控制。
技术关键词
事件触发控制方法
深度强化学习
事件触发策略
深度神经网络
贪心策略
控制器
多智能体系统
控制系统
网络拓扑结构
存储计算机程序
控制模块
处理器
存储器
计算机设备
可读存储介质
鲁棒性
表达式
数据
系统为您推荐了相关专利信息
组合深度神经网络
特征提取模块
卷积模块
负荷预测方法
嵌入特征
策略
数字孪生系统
物联网数据采集终端
深度学习网络
案例库
深度神经网络模型
静态特征
异构
节点特征
计算机存储介质
物联网服务器
周围环境数据
机器人控制方法
智能终端
机器人控制系统
电梯门禁控制方法
两轮车
电梯监控系统
深度神经网络
表达式