一种大语言模型低比特权重和激活值的动态量化方法、系统及应用

AITNT
正文
推荐专利
一种大语言模型低比特权重和激活值的动态量化方法、系统及应用
申请号:CN202410807170
申请日期:2024-06-21
公开号:CN119993134A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种大语言模型低比特权重和激活值的动态量化方法,所述动态量化方法包括如下步骤:步骤一、根据权重和激活值的不同分布特性选择量化数据类型,权重采用4比特正态浮点量化,激活值采用8比特动态树量化;步骤二、对4比特权重和8比特激活值生成量化目标编码,通过计算分位点和/或指数位长度,得到量化目标编码。在量化过程中还可以通过对待量化数据进行分块,并进行量化和/或反量化处理,对量化精度进行提升。本发明还公开了实现上述动态量化方法的动态量化系统,以及所述动态量化方法或系统的应用,具有广泛应用价值。
技术关键词
动态量化方法 大语言模型 量化系统 半轴 数量化方法 分块 硬件系统 数据编码 指数 位点 输入模块 处理器 可读存储介质 索引 存储器 精度
系统为您推荐了相关专利信息
1
智能问答方法、装置、设备、存储介质及程序产品
智能问答方法 多场景 生成提示词 大语言模型 编码向量
2
用于生成营销方案的大语言模型的训练方法及装置
大语言模型 热点 挖掘商品 数据 风险
3
基于GraphRAG和大语言模型的报支客服问答方法
问答方法 客服 大语言模型 分布式训练 数据
4
基于大模型的数据平台元数据自动生成方法
数据自动生成方法 数据平台 SQL解析器 表达式 列表
5
电网事故研判方法、装置、设备及介质
研判方法 语义特征 生成知识图谱 自然语言 多源异构数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号