摘要
本发明公开了一种任务导向群体博弈的非对称能力博弈学习方法,属于模式识别与智能系统领域,包括以下步骤:步骤S1、博弈双方分别依据非对称先验认知构造对手模型;步骤S2、博弈双方分别针对构造的对手模型确定优化的博弈解;步骤S3、博弈双方根据博弈解分别构造任务导向的群体博弈强化学习模型;步骤S4、博弈双方基于分布式训练优化步骤S3中构造的群体博弈强化学习模型,获得博弈策略;步骤S5、博弈双方在真实对手环境中进行博弈对抗,验证博弈策略的性能;本发明提供的一种任务导向群体博弈的非对称能力博弈学习方法,通过设计任务导向自我博弈强化学习算法进行非对称能力博弈参与方的策略优化,加速了博弈策略的学习。
技术关键词
学习方法
强化学习模型
策略
强化学习算法
分布式训练
智能系统
模式识别
网络
变量
样本
关系
参数
系统为您推荐了相关专利信息
管理优化系统
预警模块
热力图
数据获取模块
长短期记忆网络
无人机集群协同
深度强化学习算法
搜索方法
无人机群协同
网格
指挥控制网络
控制网络结构
节点
数据
强化学习算法
中继无人机
通信网络拓扑
节点特征
通信链路
智能轨迹规划