摘要
本申请实施例提供一种模型量化方法、模型量化装置、电子设备、芯片、存储介质及计算机程序产品,所述方法包括:对于待量化模型中的Transformer模块的任一待量化单元,根据待量化单元对应的第一向量,对待量化单元对应的第一激活值进行变换,得到第二激活值;所述第一向量用于增强所述第一激活值中重要词汇的权重;根据第一信息,调用量化模型,得到待量化单元量化后的权重;所述第一信息包括:第二激活值和第一权重;所述第一权重为待量化单元量化前的权重。
技术关键词
计算机程序产品
存储计算机程序
矩阵
电子设备
处理单元
存储器
处理器
模块
芯片
因子
聚类
语义
参数