DeePMD-kit模型在神威超级计算机的运行方法

AITNT
正文
推荐专利
DeePMD-kit模型在神威超级计算机的运行方法
申请号:CN202411593969
申请日期:2024-11-08
公开号:CN119536816B
公开日期:2025-07-22
类型:发明专利
摘要
本发明涉及计算机技术领域,特别涉及DeePMD‑kit模型在神威超级计算机的运行方法,神威超级计算机的六个核心组CG分别负责MPI进程六个子区域的推理,每个核心组CG均包括MPE和64个CPE,MPE含有256位的SIMD单元;每个CPE含有512位的SIMD单元;每个CPE均含有本地数据存储器,每个本地数据存储器LDM均通过DMA策略和主存储实现连续数据传输;同一核心组CG中的CPE之间通过远程内存访问RMA实现数据传输;每个核心组CG的推理方法为:通过SACA加速耗时算子,MPE将耗时算子的计算密集部分分配给64个CPE;计算完成后,MPE同步64个CPE的计算结果,并将结果存储至主存储器中;SACA运行时SIMD并行:通过CPE发出512位向量化指令,通过上述技术方案,本发明具有使DeePMD‑kit模型可在神威计算机应用的优点。
技术关键词
超级计算机 处理单元 数据存储器 远程内存访问 集群管理 核心 推理方法 内存访问请求 描述符 指令 进程 策略 洗牌 网络优化 表格 精度 矩阵
系统为您推荐了相关专利信息
1
变压器负载远程监控检测系统
监控检测系统 变压器绕组温度 功率 谐波畸变率 振动信号特征
2
橡胶电缆生产质量控制系统及方法
橡胶电缆 Viterbi算法 挤出设备 数据 隐马尔可夫模型
3
一种多模式隐显战术靶机及其控制系统
战术靶机 控制系统 多模式 电源管理系统 数据处理单元
4
用于多尺度圆形目标的遥感目标检测方法及系统
多尺度 处理单元 模块 边界特征 输出端
5
用于模型训练的方法、用于行为检测的方法、装置及设备
训练样本集 训练机器学习模型 终端设备 车辆 时序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号