摘要
本申请涉及强化学习技术领域,特别涉及一种基于多维指标的强化学习算法性能评估方法、装置及设备,方法包括:采集强化学习训练过程中的多维指标数据,并对多维指标数据进行预处理,得到预处理后的多维指标数据;基于预处理后的多维指标数据计算效率评分、稳定性评分和安全性评分,并基于预设的皮尔逊相关系数计算公式,根据效率评分、稳定性评分和安全性评分分析多维指标之间的相关性,得到相关性评估结果;基于相关性评估结果生成优化建议策略,以根据优化建议策略执行优化动作。由此,解决了现有强化学习评估方法中存在的指标单一,且难以准确反映算法的整体性能的问题,通过多维度指标的综合分析,实现了更准确、全面的评估与优化。
技术关键词
强化学习算法
性能评估方法
生成优化建议
指标
皮尔逊相关系数
策略
数据
性能评估装置
强化学习技术
变量
处理器
频率
信号
重构
可读存储介质
模块
存储器
电子设备
计算机