无人机异步冻结博弈对抗训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202411459888

申请日期：2024-10-18

公开号：CN119443263B

公开日期：2025-12-09

类型：发明专利

摘要

本发明公开了一种无人机异步冻结博弈对抗训练方法、装置、设备及介质，属于无人机近距空战机动决策领域。其中方法包括以下步骤：构建无人机决策模型，并对模型参数进行初始化；设计综合考虑角度和距离的耦合奖励函数，根据耦合奖励函数训练无人机决策模型；采用异步冻结博弈对抗训练方法，对我方和敌方的无人机决策模型进行训练，将训练后的模型用于控制无人机。本发明通过耦合奖励函数，能够提升无人机近距空战模型训练速度以及模型机动决策性能。另外，基于异步冻结博弈对抗方法，可以通过直接对抗的方式客观合理的评价不同强化学习模型的性能，有效地持续提升强化学习模型的性能。

技术关键词

训练无人机构建无人机控制无人机强化学习模型网络深度强化学习方法空战机动决策三维位置信息参数表达式模型训练模块代表速度训练装置电子设备程序处理器

系统为您推荐了相关专利信息

一种多任务肉品新鲜度监测方法和装置

新鲜度卷积神经网络模型机器学习模型多任务监测方法

基于模糊神经网络与自适应PID混合控制算法的人形机器人导航方法

模糊神经网络障碍物人形机器人混合控制算法扩展卡尔曼滤波

一种基于张力监测的变压器绕组铜线处理方法和系统

变压器绕组铜线表面多层前馈神经网络控制策略力学性能参数

一种面向超密集网络的安全协同缓存与计算卸载方法

基站索引超密集网络卸载方法能量控制策略

一种基于强化学习的电动汽车-光伏充电站协调控制方法

光伏充电站协调控制方法强化学习算法光伏发电功率收入

无人机异步冻结博弈对抗训练方法、装置、设备及介质

站点导航

APP 下载