摘要
本公开涉及人工智能和集群对抗技术领域,提供一种对抗集群的训练方法及系统、对抗集群的对抗方法及系统,该训练方法包括:将对抗数据实时存储到在线策略样本存储器中;每当在线策略样本存储器中的数据量超过预设的第一阈值,将数据转移到离线策略样本存储器中;从离线策略样本存储器中筛选出智能体的对抗指标最优的多个数据,得到过滤后的数据;基于在线策略样本存储器中的当前数据及过滤后的数据,确定策略梯度;基于策略梯度,更新对抗集群中的智能体的神经网络参数,以训练对抗集群。本公开可以解决集群的对抗能力弱、对抗策略固化和适应性差的问题,可以增强集群的对抗能力,提升集群持续学习演进,提高对抗策略的灵活性和适应性。
技术关键词
集群
神经网络参数
无人设备
策略
存储器
样本
数据
在线
离线
计算机可执行指令
对抗系统
训练系统
处理器
电子设备
指标
对抗技术
可读存储介质
决策
计算机程序产品
过滤单元
系统为您推荐了相关专利信息
输出轴齿轮
角度检测传感器
位置检测方法
摩擦片
检测芯片
乘客流量预测方法
时间卷积网络
卷积网络模型
残差模块
数据
道岔故障检测方法
故障检测模型
重构误差
关键点
数据