摘要
本发明公开了一种面向空间计算设备的神经网络压缩方法,属于人工智能算法的轻量化设计领域。本发明包括矩阵分块与归一化、权重聚类、重映射、矩阵重建四个阶段,整个流程以单个二维权重矩阵作为输出,输出后的压缩矩阵包括索引矩阵、Alpha矩阵、Bias矩阵、权重字典三位张量四个部分,压缩后的总存储占用量远小于初始矩阵。本发明以块作为压缩粒度,满足软硬协同需求;且归一化保证以数值纹样作为聚类标准,而且绝对数值提升聚类准确性;另外,基于高斯分布假设对于数据块的分布进行线性变换,充分考虑了空间计算架构的高能效计算特性,推动人工智能技术在边缘计算场景,如智慧城市、物联网、智能制造等领域具有广阔的应用前景。
技术关键词
神经网络压缩方法
聚类
数值
分块
数据分布
线性变换矩阵
阶段
人工智能算法
字典
人工智能技术
索引
计算方法
尺寸
中子
能效
度量
坐标
系统为您推荐了相关专利信息
城市管网系统
路径规划方法
移动传感器
管道
流速
变化趋势预测
三维模型
预警方法
动态时间规整
时序特征
噪声计算方法
数值仿真
离心泵叶轮叶片
耦合计算方法
离心泵壳体