摘要
本发明提供了一种基于数据和知识驱动的无人战机规避决策方法及智能体,模仿人类认识规则到利用规则的途径,基于知识与数据混合驱动的策略更新模式,通过离线数据库‑在线交互链的样本混合以及知识决策库‑规避智能体的策略混合两部分共同驱动策略更新,从已有的历史数据和决策经验中抽取规则知识,指导无人战机在与多阶段空战任务环境不断的交互反馈过程中,生成精准且高效的规避方案。
技术关键词
无人机规避
决策方法
策略更新方法
注意力机制
数据混合驱动
在线
离线
AC算法
样本
序列
时序
网络
分块
多阶段
编码