摘要
本发明提供了一种基于稀疏矩阵向量乘法的GPU异构加速卡性能的建模优化方法及系统,包括:确定输入的稀疏矩阵的数据特征以及GPU异构加速卡的硬件参数;将数据特征、硬件参数进行关联并作为数据集,并将数据集划分为训练集和测试集;构建基于分层决策树的性能评估模型,利用训练集和测试集对性能评估模型进行训练及测试,得到最优性能评估模型;利用最优性能评估模型对待测加速卡进行优化;本发明通过分析稀疏矩阵结构特征、先验知识的候选内核特征和加速卡硬件配置特征,基于分层决策树的可解释自适应模型有效地指导计算内核选择、参数配置的选择,在国产C86环境下的GPU加速卡平台和NVIDIA GPU加速卡平台均实现了性能提升。
技术关键词
稀疏矩阵向量乘法
异构加速卡
建模优化方法
分层决策树
内核
参数
训练集
数据
分布特征
优化所选
配置特征
决策树模型
多处理器
分析模块
算法
平台