摘要
本申请公开了一种基于大模型的文本纠错方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于大语言模型根据第一预设指令生成第一训练数据,并对预设数据进行人工标注生成第二训练数据,以构建训练数据集;通过预设文本纠错任务对应的第二预设指令和训练数据集构建相应的目标数据集,以利用目标数据集对大语言模型进行微调得到目标大语言模型;获取待纠错文本,并确定待纠错文本对应的纠错指令,以将待纠错文本和纠错指令进行拼接后输入目标大语言模型,得到纠错后的目标文本。基于大语言模型生成数据混合人工标注数据,并针对不同任务构造不同指令微调大模型,从而将拼写纠错和语法纠错串联起来,可以有效提升文本纠错准确率。
技术关键词
文本纠错方法
大语言模型
纠错文本
数据
指令
标注规则
实体
纠错装置
存储计算机程序
纠错模块
人工智能技术
语义特征
电子设备
处理器
可读存储介质
存储器