大语言模型的微调方法、装置、存储介质及计算机设备

正文

推荐专利

申请号：CN202510873548

申请日期：2025-06-26

公开号：CN120804698A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种大语言模型的微调方法、装置、存储介质及计算机设备，包括：获取基座大模型，获取目标业务场景下的样本垂类业务数据集和多个业务场景下的样本通用业务数据集；对样本通用业务数据集中的数据进行分类，得到不同分类类别的样本通用业务数据，并分别对每个分类类别的样本通用业务数据进行聚类，得到多个聚类类别下的样本通用业务数据；分别确定每个聚类类别下的样本通用业务数据数据量，并基于数据量，分别在每个聚类类别中确定样本通用业务数据的采样数量；基于采样数量，在对应聚类类别中进行数据采样，并基于采样得到的样本通用业务数据对样本垂类业务数据集进行扩充，利用扩充后的样本垂类业务数据集对基座大模型进行微调。

技术关键词

样本聚类数据大语言模型微调方法基座场景关键词计算机设备微调单元分词微调装置处理器生成随机可读存储介质索引存储器节点

系统为您推荐了相关专利信息

基于炎症营养指标的胃癌患者预后预测方法及系统

预后预测方法指标构建预测模型患者机器学习模型评估

一种充电桩预约调度与路径规划协同系统及方法

充电规划特征值协同方法速率构建预测模型

一种放大器设计参数多目标优化方法

电路仿真器邻居数据标签模拟电路优化设计预测误差

一种查询语句生成方法及电子设备

查询语句生成方法自然语言查询数据表对象字段

基于大语言模型的信息检索方法、装置、设备和介质

语义大语言模型查询建议文本信息检索方法

大语言模型的微调方法、装置、存储介质及计算机设备

站点导航

APP 下载