摘要
本发明涉及一种面向分布式异构计算节点的矩阵相乘方法、装置及系统,该方法包括:将Spark系统部署至异构分布式计算机集群,其中,每个计算机节点具有不同的CPU或者GPU配置;利用Spark作为分布式计算执行引擎,从分布式文件系统中读取矩阵数据;量化集群中的每个工作节点上的CPU或GPU计算性能;根据性能对矩阵数据进行分块,以得到矩阵块;对矩阵块执行无损浮点数压缩,并传输至各工作节点;每个工作节点按照硬件的计算性能比将矩阵块分配给CPU或GPU任务,在每个任务中,对输入矩阵块相乘以生成输出矩阵块的中间块;将输出矩阵块的中间块经过聚合,生成最终输出矩阵。本发明能够提高大规模分布式矩阵乘法的计算效率,解决传统方案存在的技术问题。
技术关键词
分布式异构计算
执行矩阵乘法
节点
分布式计算机集群
分布式文件系统
浮点数
长方体
数据读取模块
计算机可执行指令
内存
分块算法
解压缩算法
三维模型
调度器
处理器
计算机存储介质
索引