大语言模型的推理方法和装置、设备及存储介质

正文

推荐专利

申请号：CN202511099637

申请日期：2025-08-06

公开号：CN120930799A

公开日期：2025-11-11

类型：发明专利

摘要

本申请提供了一种大语言模型的推理方法和装置、设备及存储介质，适用于金融科技领域、人工智能领域。方法包括：获取原始大语言模型以及原始大语言模型的多个推理单元；针对每一推理单元，根据推理单元的多个权重参数构建压缩编码树，并通过压缩编码树对权重参数进行参数压缩，生成压缩比特流；将压缩比特流划分为多个压缩比特片段，并针对每一压缩比特片段，计算其中首个完整编码的起始比特偏移量，得到偏移数组；响应于获取到目标推理任务，针对每一推理单元，根据对应的偏移数组对压缩比特流进行解码，还原得到多个线性权重矩阵；利用多个线性权重矩阵执行目标推理任务。本申请能够实现大语言模型高效压缩的同时，减小大语言模型的性能损失。

技术关键词

压缩比特流大语言模型推理方法编码线性矩阵参数指数推理装置可读存储介质元素解码模块电子设备处理器内存符号存储器计算机

系统为您推荐了相关专利信息

数据处理方法、设备、存储介质及程序产品

大语言模型对象报告信息检索生成工具

一种心脏手术相关急性肾损伤预测方法、装置及介质

急性肾损伤心脏手术变量贝叶斯网络模型

基于多源特征融合的视频车道线检测方法

车道线检测方法多源特征融合线特征颜色分支

一种基于脉冲神经网络的无人水下航行器类脑避障决策方法、装置及存储介质

脉冲神经网络模型无人水下航行器决策方法脉冲编码器脉冲编解码器

一种地勘项目计划管理智能分析系统

智能分析系统项目风险计划资金流

大语言模型的推理方法和装置、设备及存储介质

站点导航

APP 下载