摘要
本发明公开了一种基于“规则‑智能”双策略库和模糊逻辑的智能对手选择训练框架,包括:S1、建立基于规则的对手策略库;S2、建立通过与规则策略交互生成的智能对手策略库;S3、在固定次数的训练迭代中,根据决策结果从对手策略库中选择对手;S4、进行一次评估,即令最新的智能体模型与固定的高水平规则策略进行博弈;S5、评估当前的模型性能和实时训练结果作为评价指标;S6、首先构建模糊综合评价模型,使用模糊综合评价模型来决定是否切换对手策略库,并根据该次结果选择接下来固定次数的训练迭代中使用的对手策略库。本发明在高保真空中博弈游戏等博弈游戏中,通过对对手选择框架的深入研究,提升了智能体的泛化能力和博弈性能。
技术关键词
模糊综合评价模型
策略
智能体模型
模糊逻辑
博弈游戏
隶属度函数
框架
决策
机制
指标
因子
人类
矩阵
代表
系统为您推荐了相关专利信息
噪声特征
剩余使用寿命
剩余寿命预测
耦合特征
采集机械设备
充电基站
巡检机器人
充电控制方法
检测设备
充电控制装置
可见光图像
图像恢复策略
跟踪方法
注意力模型
站台