摘要
本发明提出一种基于学习且易泛化的大规模多自主体协同博弈方法,包括以下步骤:S1:构建训练样本和新增样本;S2:基于多层感知机为每个防御自主体设计预测网络;网络输入为新增样本,输出为预测博弈结果;S3:基于图神经网络和多层感知机为每个防御自主体设计策略网络;网络输入为预测网络输出结果、每个防御自主体感知到的部分进攻方自主体的位置和速度信息、以及其他部分防御自主体的位置和速度信息,输出为每个防御自主体防御任务的概率分布;S4:基于概率分布,根据贪婪采样确认防御自主体的防御对象;S5:基于滑模控制实现防御自主体对所确认的防御对象进行追逃捕获。本发明可以实现代表防御方的大规模的多自主体系统协同博弈目标。
技术关键词
博弈方法
多层感知机
滑模控制器
生成训练样本
网络
策略
对象
速度
拓扑图
滑模控制算法
监督学习算法
监督学习方法
标签
顶点
数据分类
轨迹
代表
系统为您推荐了相关专利信息
数据库访问方法
数据存储系统
长短期记忆模型
调度特征
预测特征
管理方法
数据一致性验证
区块链存证
综合评估模型
异常状态
稳态控制方法
深度置信网络模型
优化深度置信网络
频域特征
归一化方法