摘要
本发明公开了一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法,对于包含蒙古文的图像,基于垂直投影法进行图像分割,得到一个最初的文本行直线分割结果;进行文本行粗对齐,利用粗对齐的文本行语料训练文本行识别网络,得到识别后文本字符序列;预测文本行内单词分割线,根据生成的单词分割线,结合连通域分析生成单词边框;将同一行中各个单词的边框连起来,生成一个完整包围整文本行的最小矩形框,从而构建出蒙古文文本行和词对齐语料库。本发明结合传统图像处理与深度学习模型,解决了早期铅印报纸图像因印刷缺陷导致的欠切分和过切分问题,显著提升了蒙古文文本行和单词对齐的准确性,同时降低了人工校正成本。
技术关键词
语料库构建方法
文本行
字符
图像分割
OSTU算法
序列
判定算法
深度学习模型
解码算法
极值
网络
编码
图像处理
直线
校正
报纸
中心线
系统为您推荐了相关专利信息
特征金字塔网络
弱分类器
图像分割
原始图像数据
多层次特征
医学图像分割系统
注意力
输出特征
医学图像分割方法
编码器
计算机设备
稳定极值区域
图像分割模型
荧光
图像识别方法
信息隐藏方法
敏感信息识别
存储行业
信息隐藏装置
工单预处理
RPA机器人
CV模型
计算机程序指令
光学字符识别
计算机视觉