一种基于课程强化学习的空战智能决策方法、装置、设备及介质

正文

推荐专利

申请号：CN202510444767

申请日期：2025-04-10

公开号：CN120295129A

公开日期：2025-07-11

类型：发明专利

摘要

本发明提供了一种基于课程强化学习的空战智能决策方法、装置、设备及介质，涉及强化学习领域。包括：基于多组初始状态数据确定对应的战斗优势指标；基于战斗优势指标对初始状态数据进行排序后存入难度引导的状态池；从难度引导的状态池中按照难度递增的方式更新渐进式滑动缓冲区中的初始状态数据；动态制定中间任务目标，直至为制定最终任务目标；从渐进式滑动缓冲区中采样当前初始状态数据，将当前初始状态数据输入SAC模型的策略网络得到当前动作；至少基于中间任务目标、当前动作和当前初始状态数据，对SAC模型进行训练，直至达到最终任务目标得到训练完毕的SAC模型以用于做出智能决策，提高了飞机在复杂环境中的决策能力与适应能力。

技术关键词

深度强化学习智能决策方法飞机数据策略网络仿真环境指标智能决策装置输出模块动能导弹模型训练模块武器可读存储介质动态处理器场景雷达

系统为您推荐了相关专利信息

一种基于STM32的自主水下机器人智能姿态控制系统及方法

模糊控制模块自主水下机器人姿态控制系统传感器集成模块电量监测模块

一种基于RFID技术的停车位远程监控管理系统

远程监控管理系统停车场管理服务器地磁传感器超声波传感器停车位

一种户储系统健康状态评估方法、设备及介质

系统健康状态评估方法信息熵机器学习算法模型 LSTM模型电芯

安全高效的数据传输方法及装置、设备及存储介质

数据传输方法接收方生成数据库解密数据传输装置

一种基于知识增强的多模态大模型小样本分类方法

样本分类方法答案指令图片多模态

一种基于课程强化学习的空战智能决策方法、装置、设备及介质

站点导航

APP 下载