摘要
本发明属于数据处理技术领域。提出了一种用于大模型微调训练的数据混合方法、系统及计算机设备,根据微调数据集中的不同主题的数据混合比例、微调模型参数量和训练数据的标记单元总数进行多轮训练任务,每轮训练完成后在目标数据集测试训练后的模型损失;根据各轮训练用的数据混合比例、微调模型参数量、训练数据的标记单元总数以及模型损失,构建数据混合优化函数,以数据混合优化函数的最小值为目标,确定不同微调模型参数量以及训练数据的标记单元总数下的最优的数据混合比例;本发明避免了大量的计算资源浪费,显著缩短了模型从选型到部署的研发周期,实现微调训练性价比的最大化。
技术关键词
数据混合方法
标记单元
主题
文本聚类算法
计算机设备
代表训练数据
可读存储介质
轮廓系数
数据处理技术
混合系统
指数
处理器
参数
语义
动态
系统为您推荐了相关专利信息
语义主题
视频帧
融合特征
视频摘要生成方法
语义特征提取
网络关系构建方法
地理实体
对象
语义
大语言模型