文本纠错方法、系统及存储介质

正文

推荐专利

文本纠错方法、系统及存储介质

申请号：CN202510500555

申请日期：2025-04-21

公开号：CN120373292A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种文本纠错方法、系统及存储介质，本发明属于文本纠错技术领域。包括以下步骤：获取已确认无误的文本数据作为训练语料，并通过人工标记添加分割标记，对样本进行词对分割，获得每个文本的词对及其词性。接着，利用这些数据训练词对分割模型，使其能够输出分割后的词对及对应词性。对待纠错文本输入模型后，评估其语义一致性指数。考虑词长度和词性，计算词对的复杂度指数，结合这两项生成错误判断系数。通过与设定的阈值比较，标记出待纠正的词对。计算待纠正词对与候选词对库中词对的词义相似度，选择相似度最高的词对进行替换实现文本纠错。此方法有效整合了词对分析与相似度计算，以提升文本的准确性和流畅性。

技术关键词

文本纠错方法指数纠错文本文本纠错系统复杂度语义 LSTM模型人工标记样本文本纠错技术数据错误检测模块长短期记忆网络模型训练模块逻辑网络结构字符

文本纠错方法、系统及存储介质

站点导航

APP 下载