摘要
本申请提供了一种基于分层对抗的智能体训练方法和装置,属于智能体技术领域。本申请实施例根据对抗双方各自对应的优化目标和约束条件,能够构建得到对抗双方的智能体簇,并通过构建多个对手池以及与多个对手池一一对应的多个个性化智能体簇,使得每个个性化智能体簇中的初始目标方智能体能够与具有不同优化目标和不同约束条件的对手方智能体进行对抗训练,进而得到能够适应不同对手风格的个性化智能体,最后根据多个个性化智能体的智能体参数,能够得到初始目标方智能体的智能体参数,进而得到鲁棒性和综合能力较强的个性化目标方智能体。如此,能够有效提高智能体的泛化能力,即使面临复杂多变的对抗任务时,也能取得较好的对抗效果。
技术关键词
智能体训练方法
简化智能
参数
强化学习算法
无人机
分层
抓捕装置
子模块
智能体技术
训练装置
鲁棒性
矩阵
风格