摘要
本发明涉及一种基于人类经验反馈的多智能体合围弹性控制方法,属于多智能体系统安全一致性控制技术领域,本发明结合操作员的手动输入避障、急停信号以及强化学习算法和反步法,实现多智能体系统合围弹性在线控制,能够在存在连续快速变化的执行器扰动的环境下实现在线鲁棒控制,进一步加速了学习过程,提升了多智能体系统对环境变化的适应能力;此外,反步法能够对非线性系统实现抗扰控制,使得多智能体系统中跟随者能够在存在连续快速变化的执行器扰动环境中对领导者有效合围,保持队形的一致性与任务执行的安全性;本发明能够有效应对多智能体系统MASs执行器故障,在多智能体系统存在非自治人类交互输入时,最小化选定的性能指标。
技术关键词
弹性控制方法
多智能体系统
强化学习方法
网络
表达式
误差
非线性动力学
执行器
系统对环境
强化学习算法
非线性系统
鲁棒控制
人类
方程
在线
参数
信号
效应
系统为您推荐了相关专利信息
点状缺陷
线状缺陷
触摸屏缺陷检测
曲率特征
闭合轮廓线
变压器铁芯
优化设计方法
定值参数
饱和磁通密度
遗传算法
更新方法
建筑
高分辨率遥感影像
区域高精度
城市三维模型
故障诊断方法
实时信息
大语言模型
动态网络拓扑
非暂态计算机可读存储介质