一种针对混合专家模型的参数压缩方法和装置

正文

推荐专利

申请号：CN202511062604

申请日期：2025-07-30

公开号：CN120996125A

公开日期：2025-11-21

类型：发明专利

摘要

本说明书实施例提供了一种针对混合专家模型的参数压缩方法和装置，混合专家模型用于构建大语言模型，所述大语言模型用于至少根据输入的文本数据输出处理结果，该方法包括：获取混合专家模型，混合专家模型包括N个专家模型，各个专家模型分别具有对应的参数矩阵，各个专家模型对应的参数矩阵的参数维度相同；根据N个专家模型各自对应的参数矩阵，生成M个目标矩阵、以及各个专家模型各自对应的转换矩阵，2≤M<N；对于各个专家模型，通过M个目标矩阵、以及专家模型对应的转换矩阵之间的矩阵运算，代替专家模型对应的参数矩阵。

技术关键词

矩阵参数压缩方法大语言模型机器学习方法压缩装置文本计算机可读存储介质存储器处理器数据

系统为您推荐了相关专利信息

一种基于prompt的ESG报告文本分析方法及系统

文本分析方法实质性文本分析系统关键词报告

一种化合物靶标相互作用预测方法及系统

知识图谱嵌入方法特征提取模型实体三元组靶标相互作用

GPGPU并行数据处理优化方法、设备及介质

算数逻辑单元并行数据处理粒子算法矩阵

一种融合蕨类植物示矿的多源遥感稀土矿找矿方法及系统

稀土矿找矿方法示踪元素多源遥感数据深度学习模型

一种岸桥作业队列智能调度数据处理方法

队列岸桥作业数据处理方法算法框架初始化算法

一种针对混合专家模型的参数压缩方法和装置

站点导航

APP 下载