基于小波变换和BiLLM的大语言模型量化方法

AITNT
正文
推荐专利
基于小波变换和BiLLM的大语言模型量化方法
申请号:CN202411702181
申请日期:2024-11-26
公开号:CN119599083A
公开日期:2025-03-11
类型:发明专利
摘要
本发明公开了一种基于小波变换和BiLLM的大语言模型量化方法,包括:输入LLM;对于LLM的每一个网络权重矩阵,应用Haar小波变换分解网络权重矩阵,得到小波系数矩阵;对小波系数矩阵中的低频系数部分进行分块,选出最优阈值,将小于最优阈值的权重置零,不小于最优阈值的部分进行量化,压缩小波系数矩阵的低频系数部分;应用BiLLM二值残差逼近方法,压缩小波系数矩阵的高频系数部分;LLM的每一个网络权重矩阵完成处理后,即完成LLM的量化;其中小波低频系数的量化阈值采用浮点数指数范围的线性量化替代实数轴上的线性量化。本发明结合了传统的小波变换数据压缩策略和面向LLM的BiLLM二值残差逼近算法,在保持LLM正确性的基础上实现LLM的压缩存储。
技术关键词
矩阵 数据压缩策略 浮点数 元素 分块 逼近算法 网络 指数 线性 计算方法 符号 基础
系统为您推荐了相关专利信息
1
一种存储器及其优化方法
主控单元 闪存单元 监控单元 传输接口 固件
2
基于时间状态多维矩阵的时态信息预估方法及装置
多头注意力机制 神经网络模型 矩阵 信息预估方法 对象
3
自动化操作方法、计算设备及存储介质
元素 页面 自动化操作方法 人工智能模型 节点
4
一种水中污染物特征质谱指纹的非靶向筛查方法
污染物特征 筛查方法 质谱指纹图谱 指纹图谱构建 真空泵系统
5
文本分类方法、电子设备及存储介质
文本分类方法 矩阵乘法运算 分词模型 注意力 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号