一种自适应OCR识别方法、系统、设备及介质

正文

推荐专利

申请号：CN202511232696

申请日期：2025-09-01

公开号：CN120997840A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种自适应OCR识别方法，包括以下步骤：采集图像；基于元学习框架训练得到识别模型，将图像输入识别模型中进行识别，对图像中的文本进行动态解析得到图像的多源信息，融合多源信息生成识别结果，其中，动态解析包括布局分析、语义角色标注以及上下文感知分割；本申请能够有效处理多栏混排文档中的文本定位问题，消除印章覆盖导致的坐标偏移误差，改善低质量图像中的字符分割效果。对于包含专业术语的多语种文档，通过语义角色与空间位置的联合分析，提升生僻词汇的识别准确率。在连续手写体识别场景中，上下文关联机制可减少连笔字造成的识别错误。

技术关键词

OCR识别方法语义角色标注融合多源信息在线增量学习上下文特征生成更新参数文本融合视觉特征蒙特卡洛算法语义特征手写体识别识别模型训练字符门控循环单元动态图像采集模块布局偏移误差

一种自适应OCR识别方法、系统、设备及介质

站点导航

APP 下载