申威架构上面向CNN的批量矩阵乘并行优化方法及系统

AITNT
正文
推荐专利
申威架构上面向CNN的批量矩阵乘并行优化方法及系统
申请号:CN202511020934
申请日期:2025-07-24
公开号:CN120508740B
公开日期:2025-09-23
类型:发明专利
摘要
本发明提出了申威架构上面向CNN的批量矩阵乘并行优化方法及系统,属于人工智能并行优化技术领域;包括:将卷积层中的输入特征图和卷积核分别转换为输入矩阵和权重矩阵,并批量处理为多组独立的矩阵乘法任务;主核将矩阵乘法任务封装为参数结构体数组,通过单次DMA传输至从核,从核根据线程总数和矩阵高度,采用动态行块划分算法将输入矩阵的行划分为行块任务;并对分配的独立行块执行子矩阵乘法计算,采用双缓冲DMA异步预取矩阵子块,执行矩阵乘累加计算。本发明能够提高批量矩阵乘在申威处理器主从核间的并行处理效率,优化算法性能。
技术关键词
并行优化方法 矩阵 划分算法 批量 申威架构 并行优化技术 基础 任务调度 参数 动态 局部感受野 程序 模块 缓冲 条带 内存 可读存储介质 指令 存储器 电子设备
系统为您推荐了相关专利信息
1
公交线网路径的绘制方法和绘制装置及机器可读存储介质
路段 绘制方法 绘制装置 数据 机器可读存储介质
2
一种针对复杂拓扑修形齿面的车齿加工仿真方法
仿真方法 切削刃 重构模型 轮廓识别 车齿刀具
3
一种基于PPP-B2b的定位方法和设备
数学模型 定位方法 卡尔曼滤波算法 矩阵 偏差
4
一种用于评估实习医护人员输液操作的方法及系统
触觉特征 信号特征 注意力 图谱特征 跨模态
5
一种基于语义亲和的伪装目标检测方法
物体位置信息 模块 上采样 语义 执行矩阵乘法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号