用于文本纠错的大语言模型的训练、纠错方法及相关装置

正文

推荐专利

申请号：CN202510070331

申请日期：2025-01-16

公开号：CN119494000B

公开日期：2025-04-11

类型：发明专利

摘要

本申请公开了用于文本纠错的大语言模型的训练、纠错方法及相关装置，涉及文本纠错领域，包括：获取错误正确句子对集合，错误正确句子对集合包括多个子集合，每个子集合包括一个错误文本和对应的至少一个正确文本，不同子集合内的错误文本不同；针对每个子集合包含的错误文本和对应的每个正确文本，为该错误文本和该正确文本分别标注正向纠错偏好标签和负向纠错偏好标签，得到第一训练语料；基于第一训练语料，采用预设的联合损失对初始大语言模型进行偏好调优训练，得到用于文本纠错的大语言模型。本申请基于错误文本及对应的每个正确文本均生成训练语料，避免了浪费正确文本，本申请还能够缓解模型过拟合，提高了模型泛化性能及纠错的准确性。

技术关键词

大语言模型标签文本纠错方法计算机可读指令模型训练模块电子设备计算机存储介质纠错装置存储计算机程序纠错模块计算机程序产品判别模块训练装置处理器存储器

系统为您推荐了相关专利信息

基于分层深度感知变换器的图像生成方法及其相关设备

图像生成模型图像生成方法多尺度特征金字塔变换器深度图

通过细粒度分类建模提升大语言模型代理评测准确度的方法、装置

细粒度分类大语言模型指令人工智能技术数据

数据处理方法及相关装置

数据处理模型对象计算机可执行指令数据处理方法样本

一种开放环境食材识别的多标签分类模型算法

食材识别模型算法监督深度学习特征提取器标签

基于特征融合的半监督学习方法、系统、终端及存储介质

无标签样本监督学习方法特征融合技术融合特征特征提取网络

用于文本纠错的大语言模型的训练、纠错方法及相关装置

站点导航

APP 下载