一种大语言模型微调方法及装置

AITNT
正文
推荐专利
一种大语言模型微调方法及装置
申请号:CN202410906429
申请日期:2024-07-08
公开号:CN118862956A
公开日期:2024-10-29
类型:发明专利
摘要
本发明公开了一种大语言模型微调方法及装置,包括获取微调文本数据集,并对微调文本数据集进行预处理,输出微调文本验证集和多个微调权重增量矩阵;对各微调权重增量矩阵进行逐层折叠,确定初始三阶张量;采用预置张量奇异值阈值算法对初始三阶张量进行秩约束,确定目标三阶张量;基于目标三阶张量,确定二阶低秩全局微调权重增量矩阵;采用二阶低秩全局微调权重增量矩阵和微调文本验证集对预置初始大语言模型进行权重微调,确定目标大语言模型;解决了现有的大语言模型微调方法导致大语言模型的性能较差的技术问题。
技术关键词
大语言模型 微调方法 矩阵 文本 阈值算法 分布式训练 元素 处理器 数据 训练集 计算机程序产品 微调装置 核心 指令 模块 可读存储介质 存储器 电子设备
系统为您推荐了相关专利信息
1
一种地形特征分析的道路施工方法及系统
地形特征分析 路段 道路施工方法 多模态数据采集 前馈神经网络
2
一种基于ES和NER技术的海量文件明文密码风险预警系统
风险预警系统 明文 密码 文本 日志
3
基于大数据的电力线路健康状态评估预测方法及系统
分层知识库 传输线路 异构信息网络 电力线路系统 节点
4
基于混合学习框架的半监督目标检测模型训练方法及系统
检测模型训练方法 可靠型 学生 无标签数据 无监督分类
5
一种机械设备群体协同诊断的可迁移关系优化方法
误差 梯度方法 度量 半监督聚类 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号