摘要
本发明公开了一种基于贝叶斯定理的OCR错别字修正方法,属于错别字修正技术领域,一种基于贝叶斯定理的OCR错别字修正方法,包括以下步骤:S1、收集大量专业领域的文本数据;形成词频分布模型,并对该模型频率进行转换和训练;S2、通过贝叶斯公式以及修正算法修正错别字;S3、对修正算法进行优化,增强性能,与主流方法相比,该方法有极低的训练和维护成本,具体表现在:训练无需数据标注,算法可解释性强,非深度学习,极低的算力成本,整个算法就一个动态规划,不依赖其他额外工具,记忆部署和维护。
技术关键词
修正方法
修正错别字
修正算法
字符
文本
修正技术
医疗场景
频率转换
规划
专业
数据
动态
记忆
方程
数值
序列
基础
参数