一种基于深度强化学习的多智能体合作学习方法

正文

推荐专利

申请号：CN202510538400

申请日期：2025-04-27

公开号：CN120449923A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及多智能体的控制，提供了一种基于深度强化学习的多智能体合作学习方法，其以包含队友信息的Q值为第一Q值、以不包含队友信息的Q值为第二Q值，通过两个Q值的差异，量化队友信息对当前决策的实际贡献；并引入Q值解耦，将Q值分解为状态值和动作优势；将两个Q值差异，分为用于评估协作对全局认知提升幅度的状态修正值和用于衡量协作对具体决策修正强度的动作修正值；并以此为基础，设计了通过状态修正值和动作修正值，对Q值进行动态调整的机制，因此，该方法能通过队友信息主动探索对团队有利的动作，而不是被动等待全局奖励更新，更好适应环境变化，适用于游戏、无人机编队等多智能体协作任务。

技术关键词

学习方法决策多层感知机策略超网络深度神经网络深度强化学习算法无人机编队动态注意力样本编码矩阵因子特征值噪声阶段定义

一种基于深度强化学习的多智能体合作学习方法

站点导航

APP 下载