一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法

AITNT
正文
推荐专利
一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法
申请号:CN202510635692
申请日期:2025-05-16
公开号:CN120612700A
公开日期:2025-09-09
类型:发明专利
摘要
本发明公开了一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法,对于包含蒙古文的图像,基于垂直投影法进行图像分割,得到一个最初的文本行直线分割结果;进行文本行粗对齐,利用粗对齐的文本行语料训练文本行识别网络,得到识别后文本字符序列;预测文本行内单词分割线,根据生成的单词分割线,结合连通域分析生成单词边框;将同一行中各个单词的边框连起来,生成一个完整包围整文本行的最小矩形框,从而构建出蒙古文文本行和词对齐语料库。本发明结合传统图像处理与深度学习模型,解决了早期铅印报纸图像因印刷缺陷导致的欠切分和过切分问题,显著提升了蒙古文文本行和单词对齐的准确性,同时降低了人工校正成本。
技术关键词
语料库构建方法 文本行 字符 图像分割 OSTU算法 序列 判定算法 深度学习模型 解码算法 极值 网络 编码 图像处理 直线 校正 报纸 中心线
系统为您推荐了相关专利信息
1
基于机器学习的脊柱侧弯识别系统
特征金字塔网络 弱分类器 图像分割 原始图像数据 多层次特征
2
结合位置和通道双注意力的医学图像分割系统及方法
医学图像分割系统 注意力 输出特征 医学图像分割方法 编码器
3
荧光图像识别方法、装置、电子设备及存储介质
计算机设备 稳定极值区域 图像分割模型 荧光 图像识别方法
4
一种基于行业大模型的工单敏感信息隐藏方法、装置、设备及介质
信息隐藏方法 敏感信息识别 存储行业 信息隐藏装置 工单预处理
5
使用认知人工智能层执行机器人流程自动化机器人维修
RPA机器人 CV模型 计算机程序指令 光学字符识别 计算机视觉
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号