一种大语言模型量化方法、装置及电子设备

AITNT
正文
推荐专利
一种大语言模型量化方法、装置及电子设备
申请号:CN202410831682
申请日期:2024-06-25
公开号:CN118586462A
公开日期:2024-09-03
类型:发明专利
摘要
本发明实施例公开了一种大语言模型量化方法及电子设备。方法包括:输入待量化的大语言模型;指定待量化的大语言模型的位置,运行权重平滑处理脚本对待量化的大语言模型进行权重平滑处理,得到新模型;对所述新模型进行标准量化处理,得到int8量化模型或int4量化模型。与现有技术相比,本发明实施例所提供的大语言模型量化方案,在无需校准的情况下对weight进行平滑,使weight的分布更加均匀,量化起来更加容易。使用本发明量化之后的模型效果均与AWQ和SmoothQuant的量化效果相当,但是方法更加简单便捷,部署更加高效。
技术关键词
大语言模型 脚本 数据分布 电子设备 输入设备 线性 存储计算机程序 格式 存储器 处理器 处理单元 指令 校准 模式
系统为您推荐了相关专利信息
1
通话人员身份识别方法、电子设备、存储介质及程序产品
身份识别方法 互联网协议IP地址 特征值 曲线 语音识别模型
2
基于中文链路的小语种NER优先集映射方法
中文文本 语种识别 映射方法 生成自然语言 语义
3
一种知识增强的多模态大模型实体级偏好对齐方法
偏好特征 大语言模型 视觉特征 嵌入特征 答案
4
一种鉴别造伪信息的方法、装置、设备、介质及产品
人脸图像信息 时序 数据 视频 神经网络模型
5
一种行泊控制方法、装置、设备和介质
状态机 车辆 关系 信号 通讯
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号