一种基于参数高效微调的大语言模型稀疏方法及对话生成方法

正文

推荐专利

申请号：CN202411039887

申请日期：2024-07-31

公开号：CN119025640A

公开日期：2024-11-26

类型：发明专利

摘要

本发明涉及一种基于参数高效微调的大语言模型稀疏方法及对话生成方法，其根据权重重要性度量同时稀疏LLM和低秩矩阵，保证二者具有相同的稀疏掩码，在微调之后能够合并。在每次迭代中根据互信息指标确定每一层的重要性，在保持平均稀疏率不变的情况下，为较重要的层设置较低的稀疏率，较不重要的层设置较高的稀疏率。在微调过程中计算稀疏LLM每一层的重建误差，在微调参数预算约束下，为具有较大重建误差的层分配较多的微调参数，即分配较大的秩，重建误差较小的层分配较小的秩。因此，本发明能够在高稀疏配置下显著提高大语言模型的性能。

技术关键词

大语言模型重建误差稀疏方法对话生成方法矩阵训练语料库参数文本指标数据度量

系统为您推荐了相关专利信息

一种相机BEV外参标定方法、系统、设备及介质

相机装置车道投影面标定方法坐标系

一种基于全局配准的有限空间定位闭环及定位数据有效性校验的方法及系统

雷达点云数据三维点云地图 SLAM算法有效性矩阵

充电场站运营智能定价的方法、运营服务器及存储介质

充电场站定价策略订单数据挖掘算法人工智能模型

应用于车联网路况分析的图像场景理解方法及系统

图像场景理解趋势预测模型路况潜在交互场景语义理解

基于人工智能驱动的水肥一体化多目标优化智能调控系统

人工智能驱动智能调控系统水肥一体化动态水量

一种基于参数高效微调的大语言模型稀疏方法及对话生成方法

站点导航

APP 下载