摘要
本发明涉及信息技术领域,公开了一种基于任务分解强化学习的多智能体编队协同控制方法,该方法旨在解决现有多智能体编队协同控制中任务权重分配效率低下和算法泛化能力弱的问题。方案包括建立多智能体运动模型及避障模型;设计状态、动作空间及回报函数;构建策略网络和基于任务分解的评估函数;设计深度强化学习的策略模型更新方法;设计多任务动态权重更新方法。针对复杂环境,通过多智能体编队协同控制方法,借助任务规划将任务分解为多个并行子任务,降低任务间耦合,从而降低任务间的干扰,并利用动态权重实现不同环境下最优的任务权重分配,提升智能体对不同环境的适应能力。适用于如无人机编队控制、机器人协作等。
技术关键词
编队协同控制方法
多层感知机
控制误差
障碍物
多智能体编队
策略网络模型
深度强化学习
邻居
加速度
无人机编队控制
策略更新方法
权重更新方法
模型更新方法
运动
策略优化方法
系统为您推荐了相关专利信息
调频连续波信号
调频连续波激光雷达
障碍物探测方法
分数阶傅里叶变换
能量聚集
无人机避障方法
视觉感知装置
融合视觉
激光雷达装置
可见光图像
碰撞预警方法
关键点
极限学习机
图像序列数据
机械臂姿态
融合多视角信息
融合多视角特征
稀疏特征
交叉注意力机制
人工智能深度学习