摘要
本发明公开了一种大语言模型的微调方法、装置、存储介质及计算机设备,包括:获取基座大模型,获取目标业务场景下的样本垂类业务数据集和多个业务场景下的样本通用业务数据集;对样本通用业务数据集中的数据进行分类,得到不同分类类别的样本通用业务数据,并分别对每个分类类别的样本通用业务数据进行聚类,得到多个聚类类别下的样本通用业务数据;分别确定每个聚类类别下的样本通用业务数据数据量,并基于数据量,分别在每个聚类类别中确定样本通用业务数据的采样数量;基于采样数量,在对应聚类类别中进行数据采样,并基于采样得到的样本通用业务数据对样本垂类业务数据集进行扩充,利用扩充后的样本垂类业务数据集对基座大模型进行微调。
技术关键词
样本
聚类
数据
大语言模型
微调方法
基座
场景
关键词
计算机设备
微调单元
分词
微调装置
处理器
生成随机
可读存储介质
索引
存储器
节点
系统为您推荐了相关专利信息
预后预测方法
指标
构建预测模型
患者
机器学习模型评估
电路仿真器
邻居
数据标签
模拟电路优化设计
预测误差
查询语句生成方法
自然语言
查询数据表
对象
字段