摘要
本发明涉及一种多智能体系统无碰撞的快速编队控制方法,首先通过零空间投影的方法,建立快速编队与避障的复合任务;然后将动态任务优先级规划问题转化为一个切换模式最优控制问题;最后引入强化学习任务监督器,基于集中式训练分布式执行的学习范式,实现任务模式的最优切换性能。本发明结合了多智能体强化学习方法和零空间投影方法的思想,解决了多智能体系统无碰撞的快速编队控制方法问题,无需人为设定任务优先级的切换条件,能大量减少研究人员的工作量;此外,本发明在编队控制中引入了动量项加快编队控制收敛速度,使得其较于传统的方法具有更加理性的编队避障和切换效果。
技术关键词
多智能体系统
编队控制方法
无碰撞
通信结构
拉普拉斯
矩阵
智能体强化学习方法
混合网络
速度
模式
指令
强化学习算法
变量
标志位
团队
邻居
贪心策略
参数
定义
系统为您推荐了相关专利信息
焊接系统
焊接工作台
神经网络模型构建
控制焊接机器人
工件
非线性数学模型
拉普拉斯
制导策略
代表
控制船舶