一种基于“规则-智能”双策略库和模糊逻辑的智能对手选择训练框架

正文

推荐专利

申请号：CN202510280465

申请日期：2025-03-11

公开号：CN120218279A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种基于“规则‑智能”双策略库和模糊逻辑的智能对手选择训练框架，包括：S1、建立基于规则的对手策略库；S2、建立通过与规则策略交互生成的智能对手策略库；S3、在固定次数的训练迭代中，根据决策结果从对手策略库中选择对手；S4、进行一次评估，即令最新的智能体模型与固定的高水平规则策略进行博弈；S5、评估当前的模型性能和实时训练结果作为评价指标；S6、首先构建模糊综合评价模型，使用模糊综合评价模型来决定是否切换对手策略库，并根据该次结果选择接下来固定次数的训练迭代中使用的对手策略库。本发明在高保真空中博弈游戏等博弈游戏中，通过对对手选择框架的深入研究，提升了智能体的泛化能力和博弈性能。

技术关键词

模糊综合评价模型策略智能体模型模糊逻辑博弈游戏隶属度函数框架决策机制指标因子人类矩阵代表

系统为您推荐了相关专利信息

基于CDDKD框架的机械设备剩余寿命预测方法

噪声特征剩余使用寿命剩余寿命预测耦合特征采集机械设备

配送范围图形的修正方法、装置、电子设备及存储介质

图形绘制工具顶点修正方法标识策略

巡检机器人的充电控制方法、装置和巡检机器人

充电基站巡检机器人充电控制方法检测设备充电控制装置

基于可见光-红外图像的轨道站台目标跟踪方法、装置

可见光图像图像恢复策略跟踪方法注意力模型站台

一种数据标注方法、装置、电子设备及存储介质

数据标注方法数据格式策略电子设备标注装置

一种基于“规则-智能”双策略库和模糊逻辑的智能对手选择训练框架

站点导航

APP 下载