一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法

正文

推荐专利

申请号：CN202510635692

申请日期：2025-05-16

公开号：CN120612700A

公开日期：2025-09-09

类型：发明专利

摘要

本发明公开了一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法，对于包含蒙古文的图像，基于垂直投影法进行图像分割，得到一个最初的文本行直线分割结果；进行文本行粗对齐，利用粗对齐的文本行语料训练文本行识别网络，得到识别后文本字符序列；预测文本行内单词分割线，根据生成的单词分割线，结合连通域分析生成单词边框；将同一行中各个单词的边框连起来，生成一个完整包围整文本行的最小矩形框，从而构建出蒙古文文本行和词对齐语料库。本发明结合传统图像处理与深度学习模型，解决了早期铅印报纸图像因印刷缺陷导致的欠切分和过切分问题，显著提升了蒙古文文本行和单词对齐的准确性，同时降低了人工校正成本。

技术关键词

语料库构建方法文本行字符图像分割 OSTU算法序列判定算法深度学习模型解码算法极值网络编码图像处理直线校正报纸中心线

系统为您推荐了相关专利信息

基于机器学习的脊柱侧弯识别系统

特征金字塔网络弱分类器图像分割原始图像数据多层次特征

结合位置和通道双注意力的医学图像分割系统及方法

医学图像分割系统注意力输出特征医学图像分割方法编码器

荧光图像识别方法、装置、电子设备及存储介质

计算机设备稳定极值区域图像分割模型荧光图像识别方法

一种基于行业大模型的工单敏感信息隐藏方法、装置、设备及介质

信息隐藏方法敏感信息识别存储行业信息隐藏装置工单预处理

使用认知人工智能层执行机器人流程自动化机器人维修

RPA机器人 CV模型计算机程序指令光学字符识别计算机视觉

一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法

站点导航

APP 下载