基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品

AITNT
正文
推荐专利
基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品
申请号:CN202411376160
申请日期:2024-09-29
公开号:CN118886453B
公开日期:2024-11-29
类型:发明专利
摘要
本公开涉及一种基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品,所述基于低秩量化大模型的预测方法包括:获取预测模型,其中,预测模型为大模型;通过将预测模型中的线性层的参数进行低秩分解,得到第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵;基于第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵,构建与线性层对应的量化低秩模块,其中,量化低秩模块依次包含第一激活量化层、第一线性层、尺度缩放层、第二激活量化层、和第二线性层;通过将预测模型中的线性层替换为量化低秩模块,得到压缩后的预测模型;将输入数据输入到压缩后的预测模型,得到与输入数据对应的预测结果。能够解决模型预测推理速度低下的问题。
技术关键词
矩阵 线性 计算机程序产品 数据 参数 模块 处理器 计算机可执行指令 网络 电子设备 学生 校准 模型压缩 教师 模型块 预测装置 可读存储介质 文本
系统为您推荐了相关专利信息
1
考虑热用户分类和建筑热惰性的供热系统二级网调控方法
分时段 供热系统 调控方法 阀门调控 建筑
2
一种基于配电房的智能监测方法及系统
配电设备 配电房 智能监测方法 区域环境数据 数据处理模组
3
一种多无人船分布式协同机动的动态目标跟踪控制方法
跟踪控制方法 分布式协同 速度估计 无人船 动态
4
一种隐私数据的共享管理方法
共享管理方法 溯源数据 权限访问控制 实时数据 数据分类模型
5
语音交互方法、装置及电子设备
客户端设备 收音装置 数据 语音交互方法 服务端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号