摘要
本申请公开了一种大语言模型的量化方法、推理方法及电子设备,属于大语言模型技术领域,本申请实施例的大语言模型的量化方法包括:针对大语言模型中待量化的每个线性层,将所述线性层在隐层维度上的通道划分为正常通道和离群通道;对所述正常通道对应的第一激活矩阵在分词token维度进行INT8量化得到第二激活矩阵,以及对所述正常通道对应的第一权重矩阵按输出通道进行INT4量化得到第二权重矩阵;根据所述第二激活矩阵、所述第二权重矩阵、所述离群通道对应的第三激活矩阵和所述离群通道对应的第三权重矩阵确定所述线性层的输出结果。
技术关键词
大语言模型
矩阵
预定数据格式
通道
浮点型数据
线性
推理方法
参数
电子设备
可读存储介质
处理器
分词
索引
存储器
计算机
系统为您推荐了相关专利信息
概率预测方法
机器学习工具
评估预测模型
金融
统计方法
飞机蒙皮
损伤检测方法
全局平均池化
通道注意力机制
原始图像数据
编码特征点
温度漂移系数
多面体
轴向窜动量
综合误差
分流控制方法
智慧公园
李雅普诺夫优化
多模态传感器
预测残差
信号传输通道
信号显示系统
功率放大模块
音频解码模块
HDMI接口