摘要
本公开涉及一种基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品,所述基于低秩量化大模型的预测方法包括:获取预测模型,其中,预测模型为大模型;通过将预测模型中的线性层的参数进行低秩分解,得到第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵;基于第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵,构建与线性层对应的量化低秩模块,其中,量化低秩模块依次包含第一激活量化层、第一线性层、尺度缩放层、第二激活量化层、和第二线性层;通过将预测模型中的线性层替换为量化低秩模块,得到压缩后的预测模型;将输入数据输入到压缩后的预测模型,得到与输入数据对应的预测结果。能够解决模型预测推理速度低下的问题。
技术关键词
矩阵
线性
计算机程序产品
数据
参数
模块
处理器
计算机可执行指令
网络
电子设备
学生
校准
模型压缩
教师
模型块
预测装置
可读存储介质
文本
系统为您推荐了相关专利信息
配电设备
配电房
智能监测方法
区域环境数据
数据处理模组
共享管理方法
溯源数据
权限访问控制
实时数据
数据分类模型