摘要
本申请公开了一种强化学习的泛化能力评估方法,方法包括:针对待评估的强化学习算法,输入预设参数,生成基础组件集合,基于基础组件集合构建对象集合,划分对象集合,形成训练集和测试集;基于训练集和测试集,生成训练任务和测试任务;基于训练任务和测试任务,将待训练和评估的强化学习算法部署在训练任务上进行训练,并在每一个设定训练周期后部署在测试任务上,采用多维量化评估体系进行强化学习算法评估。本发明方法建立对象由基础组件构成的层次化生成框架,并实现量化环境参数对泛化性能的影响。
技术关键词
能力评估方法
强化学习算法
对象
能力评估系统
划分算法
智能体交互
基础
生成框架
模块
训练集
处理器
参数
序列
周期
可读存储介质
存储器
机制
电子设备
程序