一种基于大模型的文本纠错方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202410920292

申请日期：2024-07-10

公开号：CN118520869A

公开日期：2024-08-20

类型：发明专利

摘要

本申请公开了一种基于大模型的文本纠错方法、装置、设备及存储介质，涉及人工智能技术领域，包括：基于大语言模型根据第一预设指令生成第一训练数据，并对预设数据进行人工标注生成第二训练数据，以构建训练数据集；通过预设文本纠错任务对应的第二预设指令和训练数据集构建相应的目标数据集，以利用目标数据集对大语言模型进行微调得到目标大语言模型；获取待纠错文本，并确定待纠错文本对应的纠错指令，以将待纠错文本和纠错指令进行拼接后输入目标大语言模型，得到纠错后的目标文本。基于大语言模型生成数据混合人工标注数据，并针对不同任务构造不同指令微调大模型，从而将拼写纠错和语法纠错串联起来，可以有效提升文本纠错准确率。

技术关键词

文本纠错方法大语言模型纠错文本数据指令标注规则实体纠错装置存储计算机程序纠错模块人工智能技术语义特征电子设备处理器可读存储介质存储器

一种基于大模型的文本纠错方法、装置、设备及存储介质

站点导航

APP 下载