摘要
本发明公开了一种自适应OCR识别方法,包括以下步骤:采集图像;基于元学习框架训练得到识别模型,将图像输入识别模型中进行识别,对图像中的文本进行动态解析得到图像的多源信息,融合多源信息生成识别结果,其中,动态解析包括布局分析、语义角色标注以及上下文感知分割;本申请能够有效处理多栏混排文档中的文本定位问题,消除印章覆盖导致的坐标偏移误差,改善低质量图像中的字符分割效果。对于包含专业术语的多语种文档,通过语义角色与空间位置的联合分析,提升生僻词汇的识别准确率。在连续手写体识别场景中,上下文关联机制可减少连笔字造成的识别错误。
技术关键词
OCR识别方法
语义角色标注
融合多源信息
在线增量学习
上下文特征
生成更新参数
文本
融合视觉特征
蒙特卡洛算法
语义特征
手写体识别
识别模型训练
字符
门控循环单元
动态
图像采集模块
布局
偏移误差