摘要
本发明提出了一种基于知识图谱的装备动态对抗博弈决策方法与装置,属于行为决策技术领域,旨在解决现有技术在动态博弈策略选择中缺乏有效性和高效性的问题。首先,本发明通过知识图谱识别目标并确定推理策略的终点。然后,利用马尔科夫决策过程模型,将博弈策略推理路径转化为序列决策问题,并通过Actor‑Critic深度强化学习方法求解。最后,通过路径搜索与多路径综合,获取最佳博弈策略。本发明提升了装备对抗决策的效率和效能,具有重要的应用价值。
技术关键词
博弈决策方法
深度强化学习方法
知识图谱推理
搜索模块
定义
特征提取模块
装备
节点
网络
融合策略
动态
多路径
特征值
匹配模块
雷达