摘要
本发明涉及一种基于错误分布指导大模型的老挝语语法纠错语料构建方法、系统、电子设备。本发明通过利用已有的语音识别模型来模拟实际出现的常见语法错误;接着,利用一种大型语言模型根据规则和约束自动生成覆盖多种错误分布的数据;然后,对这些数据进行清洗和预处理;接着,利用一种小型语言模型作为纠错模型,用来对融合语料进行纠错;最后通过模型评估,筛选出词错率更低的老挝语语法纠错语料,从而有效解决了老挝语语法纠错语料匮乏的问题。本发明通过有效利用老挝语语法的错误分布对大模型进行指导来生成老挝语语法纠错语料,在老挝语语法纠错任务上取得了较好的实验结果。
技术关键词
语料构建方法
纠错
语音识别模型
非暂态计算机可读存储介质
数据
电子设备
处理器
计算机程序产品
构建系统
存储器
词语
基础
模块
系统为您推荐了相关专利信息
旋转导向钻井
轨迹预测方法
井眼轨迹预测
教师
中间层
大数据分析平台
保险公司
反欺诈
客户
数据收集模块
抽水蓄能电站设备
数字孪生模型
健康管理方法
剩余寿命预测
仿真模型
输电线路三维模型
结构特征提取
三维重建方法
三维重建系统
关键点
分析工具
数据管理模块
自定义模型
标注工具
深度学习框架