大语言模型的训练方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411488745

申请日期：2024-10-23

公开号：CN119397010B

公开日期：2025-10-14

类型：发明专利

摘要

本申请实施例公开了一种大语言模型的训练方法、装置、计算机设备及存储介质，属于计算机技术领域。在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。

技术关键词

摘要文本语句字符大语言模型样本计算机设备标签参数可读存储介质训练装置模块存储器处理器

系统为您推荐了相关专利信息

语音交互方法、服务器和计算机可读存储介质

自然语言接口大语言模型列表语音交互方法

一种基于图神经网络的区块调整措施推荐方法和系统

嵌入特征措施推荐方法 GCN模型训练语言模型

一种建筑工程造价评估管理系统

评估管理系统建筑材料建筑工程造价票据图像特征提取票据图像处理

消息处理方法、装置、设备和存储介质

会话消息通知非暂时性机器可读存储介质消息免打扰大语言模型

基于智能体的任务处理方法、装置、设备、存储介质及程序产品

阶段账号多智能体协作自然语言理解模块

大语言模型的训练方法、装置、计算机设备及存储介质

站点导航

APP 下载