摘要
本申请实施例公开了一种大语言模型的训练方法、装置、计算机设备及存储介质,属于计算机技术领域。在该方法中,通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本,为模型训练提供了更多可学习信息,同时由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正确语句和错误语句,通过对同一样本文本的两个不同摘要文本进行对比学习,并区分学习第一摘要文本中的正确语句和错误语句,避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题,不仅提高了模型的泛化性能,还提高了模型的准确性。
技术关键词
摘要
文本
语句
字符
大语言模型
样本
计算机设备
标签
参数
可读存储介质
训练装置
模块
存储器
处理器
系统为您推荐了相关专利信息
嵌入特征
措施
推荐方法
GCN模型
训练语言模型
评估管理系统
建筑材料
建筑工程造价
票据图像特征提取
票据图像处理
会话
消息通知
非暂时性机器可读存储介质
消息免打扰
大语言模型