一种任务导向群体博弈的非对称能力博弈学习方法

正文

推荐专利

申请号：CN202411377559

申请日期：2024-09-30

公开号：CN118898297A

公开日期：2024-11-05

类型：发明专利

摘要

本发明公开了一种任务导向群体博弈的非对称能力博弈学习方法，属于模式识别与智能系统领域，包括以下步骤：步骤S1、博弈双方分别依据非对称先验认知构造对手模型；步骤S2、博弈双方分别针对构造的对手模型确定优化的博弈解；步骤S3、博弈双方根据博弈解分别构造任务导向的群体博弈强化学习模型；步骤S4、博弈双方基于分布式训练优化步骤S3中构造的群体博弈强化学习模型，获得博弈策略；步骤S5、博弈双方在真实对手环境中进行博弈对抗，验证博弈策略的性能；本发明提供的一种任务导向群体博弈的非对称能力博弈学习方法，通过设计任务导向自我博弈强化学习算法进行非对称能力博弈参与方的策略优化，加速了博弈策略的学习。

技术关键词

学习方法强化学习模型策略强化学习算法分布式训练智能系统模式识别网络变量样本关系参数

系统为您推荐了相关专利信息

一种显示工艺温度管理优化系统

管理优化系统预警模块热力图数据获取模块长短期记忆网络

一种系统性红斑狼疮小鼠模型的构建方法及其应用

系统性红斑狼疮位点小鼠模型注射液序列

一种基于深度强化学习的高度自适应无人机集群协同目标搜索方法

无人机集群协同深度强化学习算法搜索方法无人机群协同网格

基于强化学习的指挥控制网络结构和关键节点预测方法

指挥控制网络控制网络结构节点数据强化学习算法

一种临近空间通信网络中继无人机智能轨迹规划方法

中继无人机通信网络拓扑节点特征通信链路智能轨迹规划

一种任务导向群体博弈的非对称能力博弈学习方法

站点导航

APP 下载