摘要
本发明涉及一种基于神威处理器的算子融合方法,属于算子融合技术领域,包括获取深度学习模型中计算图的算子,分析算子的数据访问模式,根据预设融合判定机制确定符合融合条件的待融合算子,并获取待融合算子的特征图,特征图利用待融合算子进行数据处理,将待融合算子的参数预先加载至神威处理器的局部数据存储器中,判断特征图的总数据流与局部数据存储器的容量的大小,通过判断结果对特征图的数据块进行划分,利用数据块完成待融合算子的运算,并输出运算后的数据块,减少了数据在处理器和外部存储器之间的频繁传输,能够充分利用神威处理器的计算资源,提升并行计算效率,优化内存访问模式,减少内存带宽的瓶颈。
技术关键词
算子融合方法
数据存储器
数据访问模式
处理器
深度学习模型
分块
流水线方式
优化通信路径
并行计算效率
内存访问模式
数据依赖关系
DMA控制器
混合型
机制
指标
参数
动态
密度
接口
系统为您推荐了相关专利信息
强化学习模型
监测网页
计算机程序指令
存储计算机程序
数据
高密度服务器系统
内存条
CPLD芯片
国产化服务器
处理器
加密算法
节点
软件配置信息
加密通信方法
生成会话密钥