大模型训练方法及相关设备

正文

推荐专利

大模型训练方法及相关设备

申请号：CN202510611990

申请日期：2025-05-13

公开号：CN120725089A

公开日期：2025-09-30

类型：发明专利

摘要

本申请提供一种大模型训练方法，其特征在于，包括：收集第一数据集，并利用所述第一数据集对第一模型进行微调训练，得到第二模型；收集第二数据集，基于所述第二模型，对所述第二数据集进行优化处理，得到第三数据集；利用所述第三数据集对所述第二模型进行训练，得到最终训练好的大模型。本申请实施例通过使用自引导策略，生成大量的链式思维数据，解决了链式思维数据缺乏的问题，提升了大模型的推理能力。

技术关键词

问答对数据模型训练方法计算机程序指令模型训练装置计算机程序产品处理器存储器电子设备模块策略关系

系统为您推荐了相关专利信息

运维数据的诊断方法、装置、电子设备及计算机程序产品

节点运维知识图谱实体文本关系

基于工况识别的自适应能量分配的管理方法、装置及计算机程序产品

能量分配工况管理方法因子历史行驶数据

一种基于对比监督和跨阶段蒸馏的通用信息抽取方法

信息抽取方法矩阵自然语言文本损失函数优化基座

一种数据同步方法、双核芯片、电子设备

内核处理器数据同步方法数据存储内存访问指令

对关系数据进行关系分析的可视化系统和方法

矩阵排序模型可视化系统路径结构可视化方法

大模型训练方法及相关设备

站点导航

APP 下载