摘要
本发明提供一种多智能体博弈种群策略多样性提升方法及装置,涉及多智能体博弈对抗技术领域,所述方法基于博弈种群迭代算法生成不同概率分布的对手池,进行不同的训练任务,获得具有不同参数的前向决策模型,进而得到用于多智能体博弈的多样化的策略种群,实现了复杂的多参与方的多智能体博弈环境下的决策策略生成以及策略多样性的提升,使得多智能体在环境变量和对手策略未知的情况下进行博弈时,拥有种类更多且更为鲁棒的博弈种群策略。
技术关键词
分布式深度强化学习
迭代算法
评估算法
决策
跨节点
智能体模型
神经网络模型
仿真环境
无人驾驶汽车
分布式资源
模型更新
模块
非暂态计算机可读存储介质
策略网络模型
参数
框架
生成训练样本
系统为您推荐了相关专利信息
AI大数据
数据处理子系统
数据处理系统
跨系统
神经网络训练
图像运动信息
划分方法
编码图像序列
运动向量
CART算法