摘要
本申请公开了一种基于文本行分配的文本区域标定方法。采用光学字符识别OCR技术获取模版图片和目标图片中的文本行的文本内容以及坐标。采用一种神经网络获取目标图片中的文本行与模板图片中目标区域内的文本行的关系。根据目标图片中的文本行与模板图片中目标区域内的文本行的关系,找到目标图片中的哪些文本行对应于模板图片中的每个目标区域。排除异常文本行,将对应于模板图片中的某个目标区域的目标图片中剩余的文本行的最小外接矩形框作为在目标图片中标定的该目标区域。本申请设计交互网络学习目标图片中的文本行与模版图片中的目标区域内的文本行的关系,最终在目标图片中标定目标区域。
技术关键词
文本行
图片
区域标定方法
模版
模板
光学字符识别
注意力
矩阵
关系
坐标
元素
分配单元
交互网络
标定装置
参数
算法
阶段