一种大语言模型微调方法及装置

正文

推荐专利

一种大语言模型微调方法及装置

申请号：CN202410906429

申请日期：2024-07-08

公开号：CN118862956A

公开日期：2024-10-29

类型：发明专利

摘要

本发明公开了一种大语言模型微调方法及装置，包括获取微调文本数据集，并对微调文本数据集进行预处理，输出微调文本验证集和多个微调权重增量矩阵；对各微调权重增量矩阵进行逐层折叠，确定初始三阶张量；采用预置张量奇异值阈值算法对初始三阶张量进行秩约束，确定目标三阶张量；基于目标三阶张量，确定二阶低秩全局微调权重增量矩阵；采用二阶低秩全局微调权重增量矩阵和微调文本验证集对预置初始大语言模型进行权重微调，确定目标大语言模型；解决了现有的大语言模型微调方法导致大语言模型的性能较差的技术问题。

技术关键词

大语言模型微调方法矩阵文本阈值算法分布式训练元素处理器数据训练集计算机程序产品微调装置核心指令模块可读存储介质存储器电子设备

系统为您推荐了相关专利信息

一种地形特征分析的道路施工方法及系统

地形特征分析路段道路施工方法多模态数据采集前馈神经网络

一种基于ES和NER技术的海量文件明文密码风险预警系统

风险预警系统明文密码文本日志

基于大数据的电力线路健康状态评估预测方法及系统

分层知识库传输线路异构信息网络电力线路系统节点

基于混合学习框架的半监督目标检测模型训练方法及系统

检测模型训练方法可靠型学生无标签数据无监督分类

一种机械设备群体协同诊断的可迁移关系优化方法

误差梯度方法度量半监督聚类数据

一种大语言模型微调方法及装置

站点导航

APP 下载