基于行为体行为特征相似性的多智能体强化学习协作方法

正文

推荐专利

申请号：CN202411379921

申请日期：2024-09-30

公开号：CN119227773A

公开日期：2024-12-31

类型：发明专利

摘要

本发明公开了一种基于行为体行为特征相似性的多智能体强化学习协作方法，在该模型中，智能体之间的相互作用被建立为一个图神经网络。具体来说，提出了皮尔逊相关系数来计算主体历史轨迹的相似性，用于建模图神经网络中边的权值，作为确定其行为共同认知的一种手段；此外，利用结构化的状态信息互补模块，该模块主要依赖于基于自注意的变压器‑编码器架构，融合了其他智能体的观察和行动，以增强智能体的策略网络的表示能力。该模型有效地增强主体之间的协作行为，提高协同模型的训练效率。

技术关键词

全局状态信息协作方法模块决策编码器架构皮尔逊相关系数智能体模型轨迹编码特征超网络注意力机制节点参数矩阵表达式变压器

系统为您推荐了相关专利信息

一种数据分流方法、系统、程序产品、设备及存储介质

数据分流方法机票预订平台数据分流设备数据分流系统营销活动信息

一种生成加密短链接的网络服务方法和系统

SM2算法网络服务方法 SM4算法解密数字签名算法

OFDM系统中一种基于ProDrnNet的信道估计方法

信道估计信息解码模块信道估计方法编码模块深度残差学习网络

一种仿真驱动的铁路牵引供电系统数字孪生装置

铁路牵引供电系统数字孪生模型机车控制器电磁暂态仿真仿真方法

数据处理方法、装置、设备、介质及产品

节点同态加密算法镜像计算机程序指令数据处理方法

基于行为体行为特征相似性的多智能体强化学习协作方法

站点导航

APP 下载