一种基于分层评价图注意力网络的多智能体强化学习方法

正文

推荐专利

申请号：CN202411935205

申请日期：2024-12-26

公开号：CN120181180A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了一种基于分层评价图注意力网络的多智能体强化学习方法，状态特征编码器、图注意力网络及分层批评网络，通过智能体i与环境交互以获取观测值；所述状态特征编码器将观测值作为输入生成隐藏的状态表示；所述图注意力网络通过嵌入向量与关系图模型来计算节点和边缘特征；通过所述分层批评网络计算所有个体和集群的权重，且通过综合影响与全局信息，得到状态值；通过集中式评论家输出的个体值函数被前馈到去中心化参与者网络，其中智能体i接收自己的观察，智能体i并根据其学习到的策略独立执行动作，以执行直接影响环境的特定任。根据本发明，在合作竞争环境下智能体博弈策略具有较好的应用前景，具有策略性能好、学习更稳定、可解释性强等优势。

技术关键词

智能体强化学习方法网络分层编码器集群生成智能调度器组件节点特征关系 LSTM模型策略注意力机制异质异构项目模块

系统为您推荐了相关专利信息

一种基于AI的智联分屏远程机器人手术通信控制系统及方法

实时视频图像跟踪特征末端执行器机器人手术通信控制方法

一种RJ45电口浪涌防护结构及RJ45电口模块

浪涌防护结构网络变压器结构件底座电路板 RJ45电口模块

智能电视远程诊断和修复处理方法、装置及终端

智能电视系统人工智能算法模式识别模型语音网络连接状态

一种基于图像处理的传感器硬件木马检测方法和系统

硬件木马检测方法传感器电路训练样本集感兴趣区域图像图像处理

智能导诊方法、模型训练方法、装置、设备及存储介质

智能导诊方法多模态特征特征提取网络语义特征疾病

一种基于分层评价图注意力网络的多智能体强化学习方法

站点导航

APP 下载