大模型训练方法及相关设备

AITNT
正文
推荐专利
大模型训练方法及相关设备
申请号:CN202510611990
申请日期:2025-05-13
公开号:CN120725089A
公开日期:2025-09-30
类型:发明专利
摘要
本申请提供一种大模型训练方法,其特征在于,包括:收集第一数据集,并利用所述第一数据集对第一模型进行微调训练,得到第二模型;收集第二数据集,基于所述第二模型,对所述第二数据集进行优化处理,得到第三数据集;利用所述第三数据集对所述第二模型进行训练,得到最终训练好的大模型。本申请实施例通过使用自引导策略,生成大量的链式思维数据,解决了链式思维数据缺乏的问题,提升了大模型的推理能力。
技术关键词
问答对数据 模型训练方法 计算机程序指令 模型训练装置 计算机程序产品 处理器 存储器 电子设备 模块 策略 关系
系统为您推荐了相关专利信息
1
运维数据的诊断方法、装置、电子设备及计算机程序产品
节点 运维知识图谱 实体 文本 关系
2
基于工况识别的自适应能量分配的管理方法、装置及计算机程序产品
能量分配 工况 管理方法 因子 历史行驶数据
3
一种基于对比监督和跨阶段蒸馏的通用信息抽取方法
信息抽取方法 矩阵 自然语言文本 损失函数优化 基座
4
一种数据同步方法、双核芯片、电子设备
内核 处理器 数据同步方法 数据存储 内存访问指令
5
对关系数据进行关系分析的可视化系统和方法
矩阵 排序模型 可视化系统 路径结构 可视化方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号