摘要
本发明涉及一种基于进化算法的GPU平台低能耗算子编译优化方法及编译器,所述方法包括以下步骤:S1、首先,进化算法首先初始化算子种群,初始化算子目标代码的调度参数;S2、然后,生成新的算子个体,生成具有新调度参数的新算子目标代码;S3、在新算子个体产生后,进化算法通过在GPU上实际测量新算子目标代码的运行时间以及运行能耗的方法,综合评估不同新算子个体的竞争力大小,搜索到在运行时间以及运行能耗两个指标上都最优的新算子个体;S4、之后,进化算法判断是否满足目标;S5、若未满足目标,则进化算法进入下一代进化搜索;S6、若已满足目标,则进化算法停止。有益效果是有效地搜索到消耗时间接近最优、且耗能更低的GPU平台深度学习算子。
技术关键词
进化算法
编译优化方法
代码运行时间
能耗
平台
深度学习神经网络
参数
指标
功率
多线程
基因
接口
分块
定义
框架
基础
系统为您推荐了相关专利信息
数据智能管理方法
回归决策树
决策树模型
可视化界面
实时处理技术
金属植入物
生物力学性能参数
密度
多孔区
多模态传感器
胶囊生产线
智能控制系统
强化学习算法
调度算法
强化学习模型