摘要
本发明涉及一种基于强化学习的深度学习编译器自动调优方法。所述方法包括:通过自上而下的多层级特征相似度匹配策略,将调度任务与多层级离线数据库中的历史调度任务进行比对确定搜索的起点调度配置;根据每类调度任务对应的特征向量生成特征矩阵,通过方差阈值选择法筛选出显著维度缩减搜索空间;基于强化学习方法,选择DQN模型,通过蒙特卡罗采样策略产生随机动作,并根据随机动作变更调度配置;使用成本模型评估变更后的调度配置性能,基于评估结果构造奖励函数,完成自动调优。通过构建多层级离线数据库,利用自上而下的特征相似度匹配,可以快速检索确定起点调度配置;采用方差阈值选择法对特征维度向量进行降维,提高检索效率。
技术关键词
自动调优方法
层级
蒙特卡罗
生成特征
强化学习方法
离线
深度学习框架
策略
矩阵
深度学习模型
索引
指标
数据
机制
编码
参数