混合精度权重的处理方法、装置、设备及计算机程序产品

AITNT
正文
推荐专利
混合精度权重的处理方法、装置、设备及计算机程序产品
申请号:CN202410801312
申请日期:2024-06-19
公开号:CN118378005B
公开日期:2024-10-22
类型:发明专利
摘要
本发明实施例提供了一种混合精度权重的处理方法、装置、设备及计算机程序产品。其中,混合精度权重的处理方法包括:获取激活矩阵以及与大语言模型相对应的权重矩阵,激活矩阵中包括多个激活值,权重矩阵中包括:多个未量化模型权重和多个不同精度的量化后模型权重,未量化模型权重的精度高于量化后模型权重的精度;对权重矩阵进行分组,获得与权重矩阵相对应的多个权重分块;确定各个权重分块所对应的反量化参数,其中,同一个权重分块中的多个量化后模型权重所对应的反量化参数相同;基于反量化参数对激活矩阵与多个权重分块进行乘法运算,获得运算处理结果。
技术关键词
分块 矩阵 参数 大语言模型 计算机程序产品 精度 通道 关系 计算机存储介质 处理器 标识 电子设备 内存 文本 模块 存储器 指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号