摘要
本发明公开了一种Spark框架下GPU使能的多层次张量CP分解分布式并行加速方法,包括:读取秩为R的大规模高光谱张量数据及因子矩阵参数初始化;利用P‑CPALS方法分布式并行更新每个因子矩阵;计算error,判断本轮迭代是否满足迭代停止条件。本发明通过结合不同并行机制的Spark平台与GPU高性能技术以达到多层次并行计算的效果,探索不同子任务之间的划分机制,合理运用多层次并行的高效计算能力,实现了具有更高效、高可扩展性的密集型张量数据的并行CP分解。
技术关键词
并行加速方法
分片
矩阵
多层次
因子
GPU并行计算
分块
元素
处理器
网格
变量
计算机程序产品
框架
数据
笛卡尔
计算机设备
可读存储介质
存储器
机制
高性能
系统为您推荐了相关专利信息
半主动悬架
车身加速度
阻尼器
多头注意力机制
车辆悬架系统控制
载波相位定位方法
载波平滑伪距
整周模糊度
信号传播时延
相位观测值
指挥调度方法
车辆
数学模型
中转仓库
分层优化算法