一种协作与竞争场景下的可泛化智能体生成方法

正文

推荐专利

申请号：CN202411713024

申请日期：2024-11-27

公开号：CN119558343A

公开日期：2025-03-04

类型：发明专利

摘要

本发明公开了一种协作与竞争场景下的可泛化智能体生成方法，包括：构建多样性策略池；选取一个子环境，提取团队智能体的策略网络参数，并赋值给学习者；采用多智能体强化学习算法对学习者的策略网络参数进行优化更新，获得学习者的第一策略网络参数；构建回合记忆库，对队友和对手的观测数据进行视角对齐转换；在优化更新过程中，基于学习者观测特征，从回合记忆库中检索与学习者最匹配的观测数据；对检索到的观测数据进行位置编码处理后，基于超网络生成学习者的第二策略网络参数；结合第一策略网络参数和第二策略网络参数，获得优化后的学习者策略网络参数。本发明智能体的设定能够在当前环境下与未知的队友和对手进行有效的协作与竞争。

技术关键词

多智能体强化学习策略参数更新模块生成方法记忆超网络视角数据场景团队算法编码器生成系统转换单元处理器可读存储介质

系统为您推荐了相关专利信息

基于大语言模型的网络攻击路径推演方法、装置、设备及介质

网络攻击路径大语言模型推演方法实体关系抽取模型图谱

一种基于人脸数据的跨系统协同防护系统及方法

协同防护系统协同防护方法数字签名验证分发模块动态授权机制

具有因果混淆的安全关键场景下车辆的因果强化学习系统

强化学习系统场景动作特征网络模块车辆

一种编辑操作合并策略确定方法及装置

编辑意图识别模型策略意图类别协商机制

一种电子器件的功耗检测方法、装置、设备、存储介质

电子器件因子功耗检测方法功耗检测设备通信器件

一种协作与竞争场景下的可泛化智能体生成方法

站点导航

APP 下载