摘要
本发明公开了一种异构智能体动作策略博弈方法及系统,用于解决现有面向异构多智能体的动作策略博弈方法,导致异构智能体系统在复杂环境中的适应性差的技术问题。方法包括当异构智能体数量满足静态对抗环境条件时,对多个异构智能体进行建模,生成博弈问题,并根据博弈问题和预置动态变化因素,构建合成分队智能博弈对抗行为模型;根据各异构智能体对应的状态信息和环境信息对合成分队智能博弈对抗行为模型进行求解,生成多个异构智能体目标动作;当异构智能体数量满足动态对抗环境条件时,采用目标强化学习算法网络和层次化卷积神经网络根据各目标状态信息、目标博弈对抗环境的环境信息,生成各目标状态信息对应的异构智能体目标动作。
技术关键词
智能博弈对抗
异构
强化学习算法
博弈方法
动作策略
高层次
决策
掩码技术
网络
模型更新
计算机程序产品
模版
智能体系统
规划
可读存储介质
实体
指令