摘要
本发明涉及一种面向博弈对抗的多智能模型,其中,方法包括构建包含领域本体层、策略规则层和迁移关系层的博弈知识结构模型;将领域专家知识转化为可计算约束条件,与多智能体强化学习框架结合进行知识引导的对抗训练;通过扰动本体关联关系、修改策略约束条件和破坏场景映射关系,生成知识结构对抗测试用例;监测所述博弈知识结构模型各层的响应变化,进行策略的知识完整性、逻辑一致性和迁移鲁棒性测试,以实现博弈智能策略在知识完备性、行为合理性和跨场景适应性方面系统性保障与提升的目的。
技术关键词
智能模型
强化学习框架
关系
鲁棒性
多智能体强化学习
场景
逻辑
概念
模型训练模块
监测策略
测试模块
对抗性
处理器
计算机设备
数学
可读存储介质
存储器