用于大模型微调训练的数据混合方法、系统及计算机设备

AITNT
正文
推荐专利
用于大模型微调训练的数据混合方法、系统及计算机设备
申请号:CN202511140548
申请日期:2025-08-15
公开号:CN120725096A
公开日期:2025-09-30
类型:发明专利
摘要
本发明属于数据处理技术领域。提出了一种用于大模型微调训练的数据混合方法、系统及计算机设备,根据微调数据集中的不同主题的数据混合比例、微调模型参数量和训练数据的标记单元总数进行多轮训练任务,每轮训练完成后在目标数据集测试训练后的模型损失;根据各轮训练用的数据混合比例、微调模型参数量、训练数据的标记单元总数以及模型损失,构建数据混合优化函数,以数据混合优化函数的最小值为目标,确定不同微调模型参数量以及训练数据的标记单元总数下的最优的数据混合比例;本发明避免了大量的计算资源浪费,显著缩短了模型从选型到部署的研发周期,实现微调训练性价比的最大化。
技术关键词
数据混合方法 标记单元 主题 文本聚类算法 计算机设备 代表训练数据 可读存储介质 轮廓系数 数据处理技术 混合系统 指数 处理器 参数 语义 动态
系统为您推荐了相关专利信息
1
视频摘要生成方法、电子设备、存储介质及程序产品
语义主题 视频帧 融合特征 视频摘要生成方法 语义特征提取
2
一种结合大模型的文旅景点网络关系构建方法
网络关系构建方法 地理实体 对象 语义 大语言模型
3
电力管廊数字孪生模型创建方法、装置和系统
数字孪生模型 机器人 管廊 电力 控制平台
4
一种关于多轮对话的引导式问题推荐方法
多轮对话 主题 推荐方法 索引 加权技术
5
用于优化数字逻辑电路布局的方法、设备及存储介质
标准单元 数字逻辑电路 参数 滑动窗口 自动布局
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号