摘要
本发明公开了一种文本纠错方法、系统及存储介质,本发明属于文本纠错技术领域。包括以下步骤:获取已确认无误的文本数据作为训练语料,并通过人工标记添加分割标记,对样本进行词对分割,获得每个文本的词对及其词性。接着,利用这些数据训练词对分割模型,使其能够输出分割后的词对及对应词性。对待纠错文本输入模型后,评估其语义一致性指数。考虑词长度和词性,计算词对的复杂度指数,结合这两项生成错误判断系数。通过与设定的阈值比较,标记出待纠正的词对。计算待纠正词对与候选词对库中词对的词义相似度,选择相似度最高的词对进行替换实现文本纠错。此方法有效整合了词对分析与相似度计算,以提升文本的准确性和流畅性。
技术关键词
文本纠错方法
指数
纠错文本
文本纠错系统
复杂度
语义
LSTM模型
人工标记
样本
文本纠错技术
数据
错误检测模块
长短期记忆网络
模型训练模块
逻辑
网络结构
字符