摘要
本发明实施例涉及自然语言处理技术领域,提供一种文本纠错方法、装置、电子设备及存储介质,该方法包括:获取待纠错的目标文本并进行语义边界识别,得到全部语义边界;进而将目标文本分割成多个子句,并根据每个子句出现的顺序分配ID,生成带有序列ID的结构化数据;将结构化数据输入至语言模型中,并调用目标文本对应的目标领域知识库作为约束条件进行语义解析,识别错误类型;基于错误类型调整纠错路径进而重新识别错误信息,其中,错误信息包括错误内容、错误类型和错误位置;基于序列ID和错误内容、错误类型和错误位置重组多个子句,生成包含错误位置、错误类型及修正建议的纠错结果。由此,实现语法、语义、逻辑错误的协同检测与修正。
技术关键词
语义向量
文本纠错方法
数据
多线程并行处理
非暂态计算机可读存储介质
识别模块
语义特征
条目
序列
电子设备
处理器
纠错装置
纠错模块
识别算法
自然语言
存储器
编码