摘要
本说明书提供了一种针对LLM模型的微调方法及相关设备。针对LLM模型的微调包含依次进行的多个微调阶段,所述多个微调阶段中包括基于强化学习的微调阶段。该方法包括:获取微调数据集,所述微调数据集中包含与所述多个微调阶段对应的多种格式的第一微调数据;基于预设的目标格式,对所述多种格式的第一微调数据分别进行格式转换处理,得到与所述第一微调数据对应的目标格式的第二微调数据;其中,所述目标格式为与所述基于强化学习的微调阶段对应的第一微调数据的格式;基于所述目标格式的第二微调数据,对预训练完成的所述LLM模型进一步执行微调训练。
技术关键词
样本
格式
数据
答案
阶段
微调方法
因子
标签
计算机程序产品
处理器
医疗场景
微调单元
指令
微调装置
转换单元
语义
可读存储介质
存储器
人类
系统为您推荐了相关专利信息
甜点指示因子
参数优化方法
页岩气井
分布特征
超参数
物联网技术
数据收集模块
矩阵
场景
智能加药系统
数据项
数据管理方法
管理策略
电子商务平台
评估算法
岩性分析方法
掌子面
二维图像数据
隧洞
图像特征提取