用于大模型微调训练的数据混合方法、系统及计算机设备

正文

推荐专利

申请号：CN202511140548

申请日期：2025-08-15

公开号：CN120725096A

公开日期：2025-09-30

类型：发明专利

摘要

本发明属于数据处理技术领域。提出了一种用于大模型微调训练的数据混合方法、系统及计算机设备，根据微调数据集中的不同主题的数据混合比例、微调模型参数量和训练数据的标记单元总数进行多轮训练任务，每轮训练完成后在目标数据集测试训练后的模型损失；根据各轮训练用的数据混合比例、微调模型参数量、训练数据的标记单元总数以及模型损失，构建数据混合优化函数，以数据混合优化函数的最小值为目标，确定不同微调模型参数量以及训练数据的标记单元总数下的最优的数据混合比例；本发明避免了大量的计算资源浪费，显著缩短了模型从选型到部署的研发周期，实现微调训练性价比的最大化。

技术关键词

数据混合方法标记单元主题文本聚类算法计算机设备代表训练数据可读存储介质轮廓系数数据处理技术混合系统指数处理器参数语义动态

系统为您推荐了相关专利信息

视频摘要生成方法、电子设备、存储介质及程序产品

语义主题视频帧融合特征视频摘要生成方法语义特征提取

一种结合大模型的文旅景点网络关系构建方法

网络关系构建方法地理实体对象语义大语言模型

电力管廊数字孪生模型创建方法、装置和系统

数字孪生模型机器人管廊电力控制平台

一种关于多轮对话的引导式问题推荐方法

多轮对话主题推荐方法索引加权技术

用于优化数字逻辑电路布局的方法、设备及存储介质

标准单元数字逻辑电路参数滑动窗口自动布局

用于大模型微调训练的数据混合方法、系统及计算机设备

站点导航

APP 下载