摘要
本发明属于人工智能技术领域,为解决现有的大语言模型量化方法无法同时保障大模型的低成本硬件部署和推理效率的问题,提供一种基于极坐标体系的大模型量化压缩方法及系统。其中,基于极坐标体系的大模型量化压缩方法包括从第一存储单元中调取预存的大语言模型的原始权重参数分布,并将其处理成标准高斯分布,得到相应符合标准高斯分布的权重矢量,再转化为对应极坐标表征;分别构建各个所述极坐标表征的方向码本和模长码本,得到符合分布特征和量化敏感度特性的矢量码本并传输至第二存储单元进行存储。其能够同时保障大模型的低成本硬件部署和推理效率。
技术关键词
概率密度函数
存储单元
索引
大语言模型
分布特征
贪心算法
协方差矩阵
参数
处理器
人工智能技术
压缩系统
计算机程序产品
低成本
存储模块
可读存储介质
格式
存储器
元素
系统为您推荐了相关专利信息
交互终端
循环神经网络模型
服务端
大语言模型
Word2Vec模型
关联特征数据
财务
深度分析方法
大语言模型
企业