多智能体协作的互补注意力信息处理及奖励引导方法

正文

推荐专利

申请号：CN202510363268

申请日期：2025-03-26

公开号：CN120297317A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了多智能体协作的互补注意力信息处理及奖励引导方法，涉及多智能体强化学习技术领域，包括以下步骤：对智能体的观测信息进行再分类，分为环境信息、内部状态信息和外部状态信息；本发明中，在信息处理与决策能力上，对智能体观测信息再分类并采用注意力互补机制，提高了信息处理效率与策略网络决策性能；在训练效果方面，目标网络融入勤奋度奖励机制，改善了训练初期注意力网络的低效学习问题，提升了智能体协作意愿；本方法在星际争霸多智能体挑战场景中，与QM IX、COMA及QPLEX算法对比，在同构场景下策略收敛效率更优，且消融实验证明了互补注意力网络和勤奋度奖励机制结合的必要性，二者协同提升了注意力网络的训练稳定性和最终性能。

技术关键词

信息处理多智能体协作多智能体强化学习技术注意力机制环境状态信息协作意愿更新网络参数互补机制场景验证算法决策策略有效性阶段分段

系统为您推荐了相关专利信息

一种基于自适应下采样与多维度注意力机制的地铁危险品太赫兹检测方法

注意力机制深度学习网络模型危险品特征提取网络采样模块

基于深度学习的上市公司财务危机多维度预警方法

多维度预警方法深度神经网络模型时空注意力机制语义特征风险

一种基于深度学习和聚类的二手车推荐方法

多头注意力机制冷启动策略车辆推荐方法数据嵌入

一种基于数字人的用户操作引导方法及智能终端

动态面部表情语音文本智能服务终端音频

一种基于多视角跨模态语义对齐的多模态推荐方法及系统

多模态辅助文本多视角跨模态语义

多智能体协作的互补注意力信息处理及奖励引导方法

站点导航

APP 下载