摘要
本发明涉及计算机技术领域,特别涉及DeePMD‑kit模型在神威超级计算机的运行方法,神威超级计算机的六个核心组CG分别负责MPI进程六个子区域的推理,每个核心组CG均包括MPE和64个CPE,MPE含有256位的SIMD单元;每个CPE含有512位的SIMD单元;每个CPE均含有本地数据存储器,每个本地数据存储器LDM均通过DMA策略和主存储实现连续数据传输;同一核心组CG中的CPE之间通过远程内存访问RMA实现数据传输;每个核心组CG的推理方法为:通过SACA加速耗时算子,MPE将耗时算子的计算密集部分分配给64个CPE;计算完成后,MPE同步64个CPE的计算结果,并将结果存储至主存储器中;SACA运行时SIMD并行:通过CPE发出512位向量化指令,通过上述技术方案,本发明具有使DeePMD‑kit模型可在神威计算机应用的优点。
技术关键词
超级计算机
处理单元
数据存储器
远程内存访问
集群管理
核心
推理方法
内存访问请求
描述符
指令
进程
策略
洗牌
网络优化
表格
精度
矩阵
系统为您推荐了相关专利信息
监控检测系统
变压器绕组温度
功率
谐波畸变率
振动信号特征
橡胶电缆
Viterbi算法
挤出设备
数据
隐马尔可夫模型
战术靶机
控制系统
多模式
电源管理系统
数据处理单元
训练样本集
训练机器学习模型
终端设备
车辆
时序