大语言模型的微调方法、装置、存储介质及计算机设备

AITNT
正文
推荐专利
大语言模型的微调方法、装置、存储介质及计算机设备
申请号:CN202510873548
申请日期:2025-06-26
公开号:CN120804698A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种大语言模型的微调方法、装置、存储介质及计算机设备,包括:获取基座大模型,获取目标业务场景下的样本垂类业务数据集和多个业务场景下的样本通用业务数据集;对样本通用业务数据集中的数据进行分类,得到不同分类类别的样本通用业务数据,并分别对每个分类类别的样本通用业务数据进行聚类,得到多个聚类类别下的样本通用业务数据;分别确定每个聚类类别下的样本通用业务数据数据量,并基于数据量,分别在每个聚类类别中确定样本通用业务数据的采样数量;基于采样数量,在对应聚类类别中进行数据采样,并基于采样得到的样本通用业务数据对样本垂类业务数据集进行扩充,利用扩充后的样本垂类业务数据集对基座大模型进行微调。
技术关键词
样本 聚类 数据 大语言模型 微调方法 基座 场景 关键词 计算机设备 微调单元 分词 微调装置 处理器 生成随机 可读存储介质 索引 存储器 节点
系统为您推荐了相关专利信息
1
基于炎症营养指标的胃癌患者预后预测方法及系统
预后预测方法 指标 构建预测模型 患者 机器学习模型评估
2
一种充电桩预约调度与路径规划协同系统及方法
充电规划 特征值 协同方法 速率 构建预测模型
3
一种放大器设计参数多目标优化方法
电路仿真器 邻居 数据标签 模拟电路优化设计 预测误差
4
一种查询语句生成方法及电子设备
查询语句生成方法 自然语言 查询数据表 对象 字段
5
基于大语言模型的信息检索方法、装置、设备和介质
语义 大语言模型 查询建议 文本 信息检索方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号