一种面向神经网络大规模权值矩阵的压缩与传输方法

AITNT
正文
推荐专利
一种面向神经网络大规模权值矩阵的压缩与传输方法
申请号:CN202510340925
申请日期:2025-03-21
公开号:CN120278206B
公开日期:2025-12-16
类型:发明专利
摘要
一种面向神经网络大规模权值矩阵的压缩与传输方法,属于神经网络处理器技术领域。为解决降低数据传输成本,本发明包括将DNN模型每层的权值整理为权值矩阵;利用奇异值分解方法进行处理,得到每一层的权值矩阵的左系数矩阵、基矩阵和右系数矩阵;使用冒泡算法对基矩阵进行处理,采用对数量化与近似化压缩的方法对左系数矩阵和右系数矩阵进行处理;对处理后的每一层的左系数矩阵和右系数矩阵加载到片外动态随机存取存储器中,对处理后的权值矩阵的基矩阵加载到片上缓存中;对加载好的数据,进行数据恢复阵列设计方法,得到每一层重构的权值矩阵输入到DNN加速器中,用于DNN加速器的计算过程。本发明访存成本大幅降低。
技术关键词
矩阵 传输方法 阵列设计方法 奇异值分解方法 元素 数据恢复单元 冒泡算法 动态随机存取存储器 加速器 DNN模型 表达式 神经网络处理器 特征值 平方根 加法器 重构 数值 平铺 变量
系统为您推荐了相关专利信息
1
一种基于变异链搜索的元启发式参数优化算法
参数优化算法 样本 水文模型参数优化 空间聚类方法 水文参数
2
一种针对自动电压调节器的强化零动态攻击方法
自动电压调节器 离散系统 动态 后系统 矩阵
3
一种基于图像分割的干细胞分类方法及系统
数据 层级 多分辨率 图像分割 分类方法
4
推理计算方法及相关设备
计算方法 策略 注意力 内存 计算机程序产品
5
一种基于跨平面动态分组的云存储图像隐私保护加密方法
图像隐私保护 加密方法 图像结构 边缘检测算法 云端存储系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号