摘要
本发明公开了一种稀疏矩阵乘法加速硬件、推荐系统加速方法和AI芯片。该硬件中的数据加载单元,针对稀疏矩阵乘法任务中稠密数据,建立数据搬运任务,将稠密数据搬运至寄存器;归一化加速单元组,根据从寄存器获取的左右矩阵分块执行乘法前激活操作后,将各左右矩阵分块发送至乘法计算单元组;乘法计算单元组,用于根据左右矩阵分块的数据规模,选择乘法计算单元实施乘法计算,并将计算结果提供给加法计算单元组实施加法计算;归一化加速单元组,还用于在需要进行乘法后归一化和/或乘法后激活操作时,根据加法计算结果,实施归一化计算和/或激活操作,得到最终结果。本实施例的技术方案可以在有限的计算资源下,实现快速的稀疏矩阵乘法计算。
技术关键词
稀疏矩阵乘法
推荐系统
数据
加载单元
任务调度
分块
队列
执行器
执行乘法
深度学习模型
规模
转换单元
芯片
流水
参数
分层
元素
序列
动态
系统为您推荐了相关专利信息
比例分析方法
煤炭
燃料
机器学习算法
计算机程序指令
医疗影像数据
影像特征数据
形态
疾病风险预测方法
注意力
超声波水表
拟合系统
系统稳定性分析
关键运行参数
神经网络模型
神经网络模型
核算方法
节点
电力系统潮流
有功功率
金融产品推荐方法
对象
实体
金融产品推荐装置
节点