摘要
一种面向神经网络大规模权值矩阵的压缩与传输方法,属于神经网络处理器技术领域。为解决降低数据传输成本,本发明包括将DNN模型每层的权值整理为权值矩阵;利用奇异值分解方法进行处理,得到每一层的权值矩阵的左系数矩阵、基矩阵和右系数矩阵;使用冒泡算法对基矩阵进行处理,采用对数量化与近似化压缩的方法对左系数矩阵和右系数矩阵进行处理;对处理后的每一层的左系数矩阵和右系数矩阵加载到片外动态随机存取存储器中,对处理后的权值矩阵的基矩阵加载到片上缓存中;对加载好的数据,进行数据恢复阵列设计方法,得到每一层重构的权值矩阵输入到DNN加速器中,用于DNN加速器的计算过程。本发明访存成本大幅降低。
技术关键词
矩阵
传输方法
阵列设计方法
奇异值分解方法
元素
数据恢复单元
冒泡算法
动态随机存取存储器
加速器
DNN模型
表达式
神经网络处理器
特征值
平方根
加法器
重构
数值
平铺
变量
系统为您推荐了相关专利信息
参数优化算法
样本
水文模型参数优化
空间聚类方法
水文参数
图像隐私保护
加密方法
图像结构
边缘检测算法
云端存储系统