摘要
本发明涉及一种OCR识别技术领域,是一种用于供用电合同单据OCR识别的关键信息定位方法、装置及电子设备,包括针对表格区域利用表格结构化识别模型组对表格区域进行文本识别和表格结构解析,得到表格的HTML字符串;针对非表格区域利用文字识别模型组对非表格区域进行文本识别,得到对应的文字识别结果和坐标;抽取HTML字符串/文字识别结果中的关键信息。本发明确定供用电合同单据图像中各个关键内容区域的边界框坐标和类别,实现复杂版式划分,针对表格区域和非表格区域使用不同的模型进行文本识别,抽取关键信息,由此解决现有供用电合同单据识别中存在的由于版式复杂导致OCR识别率低的问题,为自动化合同审核提供有效保证。
技术关键词
供用电
信息定位方法
单据
信息定位装置
文本检测模型
表格区域识别
文本识别模型
坐标
语义实体
样本
网络
图像处理单元
识别模块
OCR识别率
序列识别
OCR识别技术
系统为您推荐了相关专利信息
喷码识别方法
字符识别模型
检测模型训练
图像
ONVIF协议
文字提取方法
文本检测模型
文本识别
字符
检测头
企业税务分析系统
大数据
协议文本解析
动态
数据采集模块