基于神威处理器的算子融合方法

AITNT
正文
推荐专利
基于神威处理器的算子融合方法
申请号:CN202510244893
申请日期:2025-03-04
公开号:CN119759583B
公开日期:2025-05-23
类型:发明专利
摘要
本发明涉及一种基于神威处理器的算子融合方法,属于算子融合技术领域,包括获取深度学习模型中计算图的算子,分析算子的数据访问模式,根据预设融合判定机制确定符合融合条件的待融合算子,并获取待融合算子的特征图,特征图利用待融合算子进行数据处理,将待融合算子的参数预先加载至神威处理器的局部数据存储器中,判断特征图的总数据流与局部数据存储器的容量的大小,通过判断结果对特征图的数据块进行划分,利用数据块完成待融合算子的运算,并输出运算后的数据块,减少了数据在处理器和外部存储器之间的频繁传输,能够充分利用神威处理器的计算资源,提升并行计算效率,优化内存访问模式,减少内存带宽的瓶颈。
技术关键词
算子融合方法 数据存储器 数据访问模式 处理器 深度学习模型 分块 流水线方式 优化通信路径 并行计算效率 内存访问模式 数据依赖关系 DMA控制器 混合型 机制 指标 参数 动态 密度 接口
系统为您推荐了相关专利信息
1
音频处理方法和装置
三维位置信息 音频 元素 对象 布局
2
页面自适应调整方法及装置、处理设备、存储介质、程序产品
强化学习模型 监测网页 计算机程序指令 存储计算机程序 数据
3
一种基于加固DDR4内存条的高密度服务器系统
高密度服务器系统 内存条 CPLD芯片 国产化服务器 处理器
4
一种电机三相端电压隔离采集电路及电机
隔离采集电路 信号处理 减法器电路 电机 处理器
5
一种满足异构计算中数据隐私需求的加密通信方法
加密算法 节点 软件配置信息 加密通信方法 生成会话密钥
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号