一种大型语言模型的权重压缩处理系统及装置

AITNT
正文
推荐专利
一种大型语言模型的权重压缩处理系统及装置
申请号:CN202410773993
申请日期:2024-06-17
公开号:CN118333128B
公开日期:2024-08-16
类型:发明专利
摘要
本发明提供了一种大型语言模型的权重压缩处理系统及装置,涉及大型语言模型技术领域,系统主要包括:离群值加载模块、第一缓存模块、离群值分发模块、压缩系数加载模块、第二缓存模块、第一系数分发网络模块、查找表阵列模块、第二系数分发网络模块、定点运算阵列模块、第二缓存阵列模块、浮点运算阵列模块、第三系数分发网络模块、输入矩阵加载模块、第一缓存阵列模块及输入分发网络模块。本方案可以有效支持各种权重压缩方法,可以有效减少中间结果的搬运量及数据吞吐量,可以有效降低系统功耗,进而能够适应端侧大型语言模型的应用需求。
技术关键词
网络模块 定点乘法器 浮点加法器 浮点乘法器 输入端 查找表 处理器阵列 分发模块 输出端 矩阵乘法运算 语言模型技术 浮点运算单元 存储器 浮点数 数据吞吐量 分块
系统为您推荐了相关专利信息
1
一种基于异或算法的光学偏振加密系统及方法
光学调制器 电信号发生器 加密系统 解密模块 信号编码
2
启动控制电路及芯片
启动控制电路 晶体管 电压 放大器 控制单元
3
一种基于多头自注意力机制的客户流失预测系统及方法
客户流失预测 注意力机制 特征选择 输入端 输出端
4
一种延迟可调时钟毛刺过滤电路、芯片以及电子设备
延迟可调 延迟单元 时钟 逻辑门 信号
5
一种绿色电力交易系统及方法
电力交易系统 云系统 计量终端 存储模块 多元线性回归模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号