一种基于错误分布指导大模型的老挝语语法纠错语料构建方法、系统、电子设备

AITNT
正文
推荐专利
一种基于错误分布指导大模型的老挝语语法纠错语料构建方法、系统、电子设备
申请号:CN202411848270
申请日期:2024-12-16
公开号:CN119783661B
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及一种基于错误分布指导大模型的老挝语语法纠错语料构建方法、系统、电子设备。本发明通过利用已有的语音识别模型来模拟实际出现的常见语法错误;接着,利用一种大型语言模型根据规则和约束自动生成覆盖多种错误分布的数据;然后,对这些数据进行清洗和预处理;接着,利用一种小型语言模型作为纠错模型,用来对融合语料进行纠错;最后通过模型评估,筛选出词错率更低的老挝语语法纠错语料,从而有效解决了老挝语语法纠错语料匮乏的问题。本发明通过有效利用老挝语语法的错误分布对大模型进行指导来生成老挝语语法纠错语料,在老挝语语法纠错任务上取得了较好的实验结果。
技术关键词
语料构建方法 纠错 语音识别模型 非暂态计算机可读存储介质 数据 电子设备 处理器 计算机程序产品 构建系统 存储器 词语 基础 模块
系统为您推荐了相关专利信息
1
基于深度学习与知识蒸馏的旋转导向钻井轨迹预测方法
旋转导向钻井 轨迹预测方法 井眼轨迹预测 教师 中间层
2
一种通用雇主责任保险风险管理优化系统及方法
大数据分析平台 保险公司 反欺诈 客户 数据收集模块
3
基于数字孪生的抽水蓄能电站设备健康管理方法及系统
抽水蓄能电站设备 数字孪生模型 健康管理方法 剩余寿命预测 仿真模型
4
一种基于边缘侧计算的输电线路三维重建方法及系统
输电线路三维模型 结构特征提取 三维重建方法 三维重建系统 关键点
5
人工智能标注训练一体系统及方法
分析工具 数据管理模块 自定义模型 标注工具 深度学习框架
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号