摘要
本发明提供了一种大型语言模型的权重压缩处理系统及装置,涉及大型语言模型技术领域,系统主要包括:离群值加载模块、第一缓存模块、离群值分发模块、压缩系数加载模块、第二缓存模块、第一系数分发网络模块、查找表阵列模块、第二系数分发网络模块、定点运算阵列模块、第二缓存阵列模块、浮点运算阵列模块、第三系数分发网络模块、输入矩阵加载模块、第一缓存阵列模块及输入分发网络模块。本方案可以有效支持各种权重压缩方法,可以有效减少中间结果的搬运量及数据吞吐量,可以有效降低系统功耗,进而能够适应端侧大型语言模型的应用需求。
技术关键词
网络模块
定点乘法器
浮点加法器
浮点乘法器
输入端
查找表
处理器阵列
分发模块
输出端
矩阵乘法运算
语言模型技术
浮点运算单元
存储器
浮点数
数据吞吐量
分块
系统为您推荐了相关专利信息
光学调制器
电信号发生器
加密系统
解密模块
信号编码
客户流失预测
注意力机制
特征选择
输入端
输出端
电力交易系统
云系统
计量终端
存储模块
多元线性回归模型