摘要
本发明涉及一种面向二对二飞行员博弈对抗的规则化策略构建方法,属于二对二空战智能体的行为建模与仿真技术领域,本发明通过聚类分析从深度强化学习算法训成的智能体行为数据中提取构建智能体的策略逻辑,将其进行规则化,并且采取沙普利Shapley值方法分析所生成规则的优劣,形成一套可读性强、可解释的基于规则的策略,为深度强化学习在空战决策中的实际应用提供技术支撑,同时也为空战智能体的行为建模提供了一种新的思路,针对二对二空战智能体行为策略建模困难、专业知识难以获取、行为模型应用困难的现状和技术瓶颈。
技术关键词
数据
轮廓系数
策略
坐标系
聚类
深度强化学习算法
表达式
生成规则
机体
贡献率
速度
方位角
场景
武器
思路
瓶颈
系统为您推荐了相关专利信息
监控工业园区
管理系统
有害气体传感器
数据采集模块
机器学习算法分析
感兴趣
图像获取模块
过滤模块
输出模块
图像处理