摘要
本发明公开了一种小语种文本图像识别错字修正方法及系统,其中所述方法包括:获取小语种文本图像,采用预设的基于小波变换的自适应阈值去噪算法去除小语种文本图像的高频噪声,生成去噪后图像。从去噪后图像中提取至少一个字符的形态轮廓特征,形态轮廓特征包括笔画粗细、笔画数量及笔顺方向,并将特征输入支持向量机分类模型,确定去噪后图像的语种类别,生成语种分类结果。根据语种分类结果加载对应的字符切分模型及语料库,对去噪后图像进行逐字符切分及模式匹配识别,生成每个字符的初步识别结果及识别置信度评分。本发明的小语种文本图像识别错字修正方法,提高了小语种字符识别的准确性和错字矫正能力,可以应对复杂场景下的识别挑战。
技术关键词
文本图像识别
字符
识别置信度
轮廓特征
修正方法
语义角色标注
支持向量机分类
文本生成模型
上下文语境信息
标注算法
去噪算法
笔画结构
形态学分析方法
模式匹配算法
系统为您推荐了相关专利信息
嵌入方法
支持向量检索
语义向量
动态更新
数据存储
商用密码
漏洞
安全性评估方法
密码转换方法
编码
实体
研发项目管理系统
知识图谱构建
医疗器械
构建知识图谱