摘要
本申请公开了一种面向矩阵加速单元的矩阵乘法优化方法及其系统,方法包括:通过矩阵加速单元提供的矩阵乘指令集,采用线程重排、地址映射策略及多级流水线机制,共同构建微内核生成框架,生成候选微内核集合;针对输入矩阵进行特征提取,根据输入矩阵特征构建一个动态分块与调度策略构成的搜索空间,动态选择最优微内核并动态调整调度策略;构建性能预测模型,对候选微内核集合进行建模与剪枝,在搜索空间中优先选出最优调度策略组合,实现面向矩阵加速单元的矩阵乘法的优化。本发明方法显著提升了矩阵乘法优化的自动化程度和适应性,是一个可应用于多种矩阵乘架构并支持动态输入场景的通用高性能优化方案。
技术关键词
矩阵乘法优化方法
性能预测模型
流水线
地址映射
生成框架
并行处理单元
硬件平台
单指令多数据
动态
代码生成器
分块策略
等待指令
拷贝
模板
坐标
机制
处理器
系统为您推荐了相关专利信息
光伏发电系统
光伏发电故障检测
历史运行数据
性能预测模型
神经网络模型构建
射频收发芯片
抽头
数据写入单元
数据运算单元
数据存储
复合材料
性能预测模型
性能预测方法
应变传感器
泊松比
智能运维平台
性能监控
性能预测模型
长短记忆神经网络
对象