摘要
本申请提供了一种正文和水印的识别方法、装置及应用方法,基于正文和水印的文本行在倾斜角度上的差异,能够高效准确区分并识别文档图像中的正文和水印,从而提高OCR识别的准确性。还能支持图像角度校正、含有水印信息的版面恢复等应用。方法包括:获取待处理文档图像;对待处理文档图像以文本行为目标利用深度学习模型进行目标检测,得到各文本行在图像中的位置信息,文本行为图像中包含文本的矩形区域;根据各文本行的位置信息,确定各文本行相比于水平方向的倾斜角度;根据各文本行的倾斜角度的差异,确定第一集合和第二集合,第一集合包含内容为正文文本的文本行,第二集合包含内容为水印文本的文本行。
技术关键词
文本行
水印
光学字符识别
校正
识别文档图像
识别方法
训练深度学习模型
基准
图像获取模块
样本
分布特征
识别装置
像素
曲线
矩形
数据
系统为您推荐了相关专利信息
文本
定位规则
上下文特征
水印嵌入方法
大语言模型
综合判断方法
车型数据库
神经网络分类
环境监测数据
标签