摘要
本发明涉及一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法、系统。本发明将音似错误融合到提示指令中,从而构建音似错误约束的指令集;然后利用指令集引导开源大模型ChatGLM自动生成候选缅甸语语法纠错语料,并对生成的缅甸语语法纠错语料进行后处理;最后将大模型生成的纠错语料和语音识别模型生成的纠错语料融合来缓解缅甸语纠错语料匮乏的问题,同时尝试通过微调预训练语言模型mBART进一步提升缅甸语纠错性能。本发明通过有效利用开源大模型ChatGLM对自然语言进行高度理解和处理的特性来自动生成缅甸语语法纠错语料,在缅甸语语法纠错任务上尤其是对于音似错误的任务上取得了较好的实验结果。
技术关键词
语料构建方法
纠错
预训练语言模型
语音识别模型
非暂态计算机可读存储介质
词语
处理器
计算机程序产品
构建系统
自然语言
同义词
指令
字符
存储器
电子设备
文本
数据
接口