摘要
本发明属于大语言模型微调技术领域,公开了一种对大模型在随机子空间上进行零阶优化微调的方法及系统,方法包括:获取目标领域的任务数据,对目标领域的任务数据进行预处理,获得大模型所需格式的数据集;使用获得的数据集微调预训练好的大语言模型;将待处理的数据输入微调后的大语言模型,完成目标领域的任务。本发明旨在解决高维LLM微调的挑战。
技术关键词
矩阵
大语言模型
数据
微调技术
超参数
模块
格式
系统为您推荐了相关专利信息
改进型卷积神经网络
剩余寿命预测系统
序列
滑动窗口法
批量
样本管
视觉识别单元
动作策略
USB数据线
存储机构
话题
大语言模型
多轮对话方法
记忆管理
电子设备