摘要
本公开涉及文本校正技术领域,具体提供了一种文本校正的方法、装置、电子设备、存储介质及程序产品。其中,该方法包括:对待处理文本中包含的多个指定类型的目标对象分别进行掩码处理,获得目标文本;根据目标文本中的掩码位置,将目标文件进行片段截取,获得包含掩码的多个文本片段;根据向量转换模型,对各文本片段分别进行向量转换,获得各文本片段分别对应的文本向量;对各文本向量进行无监督聚类处理,获得至少一个文本向量簇,及其分别对应的参考文本向量;分别根据每一参考文本向量对应的参考对象,将对应的文本向量簇中包含的文本向量对应的目标对象进行校正。这样,解决了文本难以纠错的问题。
技术关键词
文本校正
计算机可读代码
无监督聚类
样本
预训练模型
电子设备
可读存储介质
对象识别
计算机程序产品
文本识别
处理器
校正单元
转换单元
数据
指令
标签