摘要
本发明提出一种面向多核并行体系结构的卷积算子编译优化方法和装置。包括:输入转换器模块提取和去重模型中的或者用户输入的卷积参数,并生成卷积描述符组;控制器模块根据历史记录决定是否对输入模块启动调优,将需要调优的卷积描述符传递给调优器模块;调优器模块负责根据配置好的参数空间进行算子的自动调优,输出最佳参数配置;代码生成模块根据接收到的调优参数组合及卷积描述符生成HIP代码,并分别对各个参数生成的核函数进行对应编号。核函数执行模块编译和执行已生成的代码,并通过测试框架对各个核函数的性能进行测试,按编号返回对应的适应度信息并汇总为列表返回给调优器模块。
技术关键词
描述符
编译优化方法
神经网络加速器
多核并行
字典
模块
代码生成器
矩阵
硬件资源信息
信息显示设备
轮盘赌算法
模板
优化装置
格式
待测参数
分块策略
内存
流水
标识符
系统为您推荐了相关专利信息
柔性线路板
线路缺陷识别
图像识别模型
缺陷检测方法
多视角
离散型金属
超分子笼
组装体
拓扑结构数据
机器学习模型训练