大语言模型的量化方法、推理方法及电子设备

AITNT
正文
推荐专利
大语言模型的量化方法、推理方法及电子设备
申请号:CN202510118310
申请日期:2025-01-24
公开号:CN120354895A
公开日期:2025-07-22
类型:发明专利
摘要
本申请公开了一种大语言模型的量化方法、推理方法及电子设备,属于大语言模型技术领域,本申请实施例的大语言模型的量化方法包括:针对大语言模型中待量化的每个线性层,将所述线性层在隐层维度上的通道划分为正常通道和离群通道;对所述正常通道对应的第一激活矩阵在分词token维度进行INT8量化得到第二激活矩阵,以及对所述正常通道对应的第一权重矩阵按输出通道进行INT4量化得到第二权重矩阵;根据所述第二激活矩阵、所述第二权重矩阵、所述离群通道对应的第三激活矩阵和所述离群通道对应的第三权重矩阵确定所述线性层的输出结果。
技术关键词
大语言模型 矩阵 预定数据格式 通道 浮点型数据 线性 推理方法 参数 电子设备 可读存储介质 处理器 分词 索引 存储器 计算机
系统为您推荐了相关专利信息
1
基于Python和机器学习的碳金融违约风险概率预测方法和装置
概率预测方法 机器学习工具 评估预测模型 金融 统计方法
2
一种适用于雨雾条件的深度学习飞机蒙皮损伤检测方法
飞机蒙皮 损伤检测方法 全局平均池化 通道注意力机制 原始图像数据
3
用于3D物位测量的空间旋转轴标定方法及系统
编码特征点 温度漂移系数 多面体 轴向窜动量 综合误差
4
一种智慧公园的安全分流控制方法
分流控制方法 智慧公园 李雅普诺夫优化 多模态传感器 预测残差
5
信号源输入信号显示系统及方法
信号传输通道 信号显示系统 功率放大模块 音频解码模块 HDMI接口
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号