摘要
本申请公开了一种基于双评价网络的多无人机协同对抗决策方法,属于人工智能技术领域。该方法包括:获取目标无人机执行第一动作的第一本地观测状态和动作信息;将第一本地观测状态和动作信息输入至双评价网络,得到双评价网络输出的联合动作;基于联合动作对应的奖励值,对双评价网络进行循环计算,直至奖励值收敛,确定目标无人机需要执行的第二动作的动作参数;其中,在双评价网络循环计算的过程中,对第一当前Critic网络和第二当前Critic网络计算的第一动作的动作价值取最小值,以对当前Actor网络进行参数更新。该方法优化了无人机的博弈决策。
技术关键词
无人机协同对抗
决策方法
无人机群对抗
参数
网络结构
人工智能技术
导弹
处理器
存储器
电子设备
模块
变量
策略
因子
程序
模式