大语言模型合并方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411518905

申请日期：2024-10-29

公开号：CN119476418A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供一种大语言模型合并方法、装置、电子设备及存储介质，包括：基于合并模型在下游任务的任务目标，确定模型合并所使用的密度超参数和模型合并系数超参数；基于密度超参数生成掩码矩阵，基于掩码矩阵、两个待合并模型各自的模型参数以及基础模型的模型参数，分别确定两个待合并模型的任务向量；基于两个待合并模型之间对应神经元的参数向量角、两个待合并模型的任务向量以及模型合并系数超参数，确定合并模型的任务向量；基于合并模型的任务向量和基础模型的模型参数，得到合并模型。采用上述技术方案，解决了现有的模型合并方法得到的合并模型的性能不佳的问题。

技术关键词

模型合并方法超参数掩码矩阵大语言模型元素非暂态计算机可读存储介质基础电子设备密度处理器计算机程序产品模块存储器因子

系统为您推荐了相关专利信息

一种适用于互联网场景下使用的音频保护方法

音频保护方法递归算法互联网元素矩阵

一种问题晶圆批次的排序方法、设备、介质及产品

机器学习回归算法排序方法晶圆数据计算机程序指令

一种基于隐私增强的智能电网联邦学习窃电检测方法

窃电检测方法智能电网时序特征能耗数据中心

UI自动化测试方法、装置、设备、介质、产品

页面结构图像分类模型元素 UI自动化测试标签

一种地图信息的获取方法以及相关装置

视角机器学习模型车道图像三维地图信息

大语言模型合并方法、装置、电子设备及存储介质

站点导航

APP 下载