摘要
本发明公开了一种混合粒度稀疏神经网络训练加速器及计算加速方法,包括输入缓存、权重缓存、输出缓存、行位图缓存、元素位图缓存以及稀疏计算模块;所述稀疏计算模块进一步包括一个行稀疏跳过单元和若干个稀疏卷积单元以及一个累加器;采用行、元素两级位图表示神经网络训练的不同阶段中卷积计算的输入、权重和输出的行、元素粒度的稀疏性;针对输出行位图非零标志,对输入和权重的行位图进行滑动匹配,发现并剔除包含全零行的无效一维卷积计算,实现粗粒度稀疏的利用;在执行有效一维卷积计算的过程中发现并剔除包含零值的无效乘累加计算,实现细粒度稀疏的利用。与现有技术相比,本发明能够提高神经网络训练效率,降低训练时长与能量消耗。
技术关键词
稀疏神经网络
加速器
元素
计算机可读指令
检测器
神经网络训练
索引
译码器
移位器
匹配器
乘累加器
加速计算方法
标志位
数据
格式
控制器
输入端
阶段
处理器
系统为您推荐了相关专利信息
异构设备
复杂度
任务调度器
动态电压频率调节
功率
正向运动学
雅可比矩阵
CORDIC算法
神经网络量化
平台
鼻咽癌放疗
计划生成方法
放疗计划
人工智能生成方法
剂量体积直方图
无线电缆
校准
构建预编码矩阵
上存储计算机程序
电子设备