摘要
本申请涉及人工智能技术领域,特别是涉及基于国产神威处理器的pytorch移植方法,包括:在pytorch框架和神威处理器之间配置一架构适配层swMath,实现所述多个适配接口与pytorch框架的pytorch算子一一映射;识别pytorch框架中的高性能计算库,实现所述高性能计算库并基于神威处理器进行优化,得到优化后的高性能计算库后,整合为统一的动态链接库并与pytorch框架的libtorch.so库链接;在X86平台上使用针对神威处理器的交叉编译器sw‑gcc和sw‑g++编译C/C++库文件代码,生成神威处理器可执行文件并在神威处理器上运行。通过本申请实现pytorch框架在神威处理器上的高效运行,提升深度学习任务的计算效率和性能。
技术关键词
处理器
高性能
Python扩展模块
动态链接库
CUDA平台
并行编程模型
框架
性能计数器
深度神经网络
接口
人工智能技术
脚本
数学
基础
数据
切片
内存
命令
核心
系统为您推荐了相关专利信息
同步电机
复矢量电流调节器
电流调节方法
永磁
电机定子电阻