一种协作与竞争场景下的可泛化智能体生成方法

AITNT
正文
推荐专利
一种协作与竞争场景下的可泛化智能体生成方法
申请号:CN202411713024
申请日期:2024-11-27
公开号:CN119558343A
公开日期:2025-03-04
类型:发明专利
摘要
本发明公开了一种协作与竞争场景下的可泛化智能体生成方法,包括:构建多样性策略池;选取一个子环境,提取团队智能体的策略网络参数,并赋值给学习者;采用多智能体强化学习算法对学习者的策略网络参数进行优化更新,获得学习者的第一策略网络参数;构建回合记忆库,对队友和对手的观测数据进行视角对齐转换;在优化更新过程中,基于学习者观测特征,从回合记忆库中检索与学习者最匹配的观测数据;对检索到的观测数据进行位置编码处理后,基于超网络生成学习者的第二策略网络参数;结合第一策略网络参数和第二策略网络参数,获得优化后的学习者策略网络参数。本发明智能体的设定能够在当前环境下与未知的队友和对手进行有效的协作与竞争。
技术关键词
多智能体强化学习 策略 参数更新模块 生成方法 记忆 超网络 视角 数据 场景 团队 算法 编码器 生成系统 转换单元 处理器 可读存储介质
系统为您推荐了相关专利信息
1
基于大语言模型的网络攻击路径推演方法、装置、设备及介质
网络攻击路径 大语言模型 推演方法 实体关系抽取模型 图谱
2
一种基于人脸数据的跨系统协同防护系统及方法
协同防护系统 协同防护方法 数字签名验证 分发模块 动态授权机制
3
具有因果混淆的安全关键场景下车辆的因果强化学习系统
强化学习系统 场景 动作特征 网络模块 车辆
4
一种编辑操作合并策略确定方法及装置
编辑 意图识别模型 策略 意图类别 协商机制
5
一种电子器件的功耗检测方法、装置、设备、存储介质
电子器件 因子 功耗检测方法 功耗检测设备 通信器件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号