一种特定领域的中文文本纠错方法及系统

正文

推荐专利

一种特定领域的中文文本纠错方法及系统

申请号：CN202511263630

申请日期：2025-09-05

公开号：CN120745608A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开一种特定领域的中文文本纠错方法及系统，本发明的方法包括以下步骤：准备批量文本数据，利用文本数据训练Ngram统计语言模型、bert文本分类模型、bert文本语言模型；将待纠错文本进行文本预检测，得到错误文本以及正确文本；对获取到的错误文本进行错误检测，得到错误文本以及错误位置信息；对错误检测检测出的错误文本进行正确文本候选集替换，得到一系列候选集，根据候选集获取最后的文本纠错结果。本发明对于正式场合的书面表达术语，特定用词能够按照人工维护的方式进行准确纠错，同时对于常见错别字深度学习语言模型拥有着良好的纠错能力。

技术关键词

中文文本纠错统计语言模型错误检测纠错文本文本分类模型深度学习语言模型数据平滑技术批量分词语句模块术语参数

系统为您推荐了相关专利信息

一种用于数字科技个性化服务的供需匹配方法

供需匹配方法自然语言文本分类模型标签词嵌入模型

一种基于BERT模型的简历筛选方法

简历筛选方法主题词向量 BERT模型文本主题词信息熵

一种基于政务大数据的学生入学资格录入方法及系统

门控循环单元政务大数据平台学生管理系统数据访问控制数据校正

文本信息提取方法、装置、设备以及介质

文本信息提取方法感兴趣视频流视频帧车辆测试

一种实验室检测报告校对方法及其系统

报告校对方法错误检测数据文本

一种特定领域的中文文本纠错方法及系统

站点导航

APP 下载