训练大语言模型的方法和装置

正文

推荐专利

训练大语言模型的方法和装置

申请号：CN202510874340

申请日期：2025-06-26

公开号：CN120764618A

公开日期：2025-10-10

类型：发明专利

摘要

本说明书实施例提供一种训练大语言模型的方法和装置。第一大语言模型的生成数据包括，针对输入问题的答案或者针对输入问题的查询语句。方法包括：获取第一训练样本和第二训练样本，所述第一训练样本中的样本标签包括针对该第一训练样本中的输入问题的答案，所述第二训练样本中的样本标签包括针对该第二训练样本中的输入问题的查询语句；基于所述第一训练样本和所述第二训练样本，对所述第一大语言模型进行监督训练。能够保证稳定训练。

技术关键词

大语言模型语句答案样本文本标签指令标记计算机数据可读存储介质存储器策略处理器参数序列

系统为您推荐了相关专利信息

基于深度学习的乳腺癌保乳术后瘤床靶区自动勾画系统

乳腺癌保乳勾画系统深度学习模型图像处理单元混合损失函数

一种文本生成图像方法、装置、设备及介质

文本生成图像方法注意力对象图像生成单元可读存储介质

一种基于人工智能的城市设计噪声优化方法和系统

三维城市模型多层感知器网络大语言模型噪声预测模型噪声优化方法

广告创意效果的预测方法、装置、设备和可读存储介质

多层感知网络图像视觉特征显著性检测模型样本

智慧城市多模态数据采集融合方法及系统

智慧城市系统机器可读数据多模态数据采集朴素贝叶斯模型方差贡献率

训练大语言模型的方法和装置

站点导航

APP 下载