摘要
本公开涉及基于关键信息提取的证件资料页识读方法、系统和设备。方法包括:获取证件资料页照片;基于霍夫变换,对存在整体倾斜和/或存在几何畸变的证件资料页照片进行图像校正;利用PP‑OCRv5引擎识别证件资料页照片的文本内容、文字坐标和文本行方向置信度,判断文本行方向置信度是否低于阈值,若是则以新的霍夫变换参数重进行图像校正;利用版式分类模块确定证件资料页照片的版式类别,模块能够根据文字坐标定位机读码信息,根据签发国代码确定国别,根据国别确定证版式类别;将文本内容和文字坐标输入到所述版式类别对应的预训练的UIE‑X模型中进行信息抽取。本公开兼顾了训练耗费少和关键信息识别准确度高的优点。
技术关键词
证件
识读方法
图像校正
资料
照片
文本行
识读系统
坐标
模型训练模块
文本识别
图片
程序
存储器
处理器
参数
直线
电子设备
关系
系统为您推荐了相关专利信息
BIM地质模型
措施
水文监测设备
水位监测设备
深基坑开挖施工
土压力计算方法
基坑
三维场景模型
静止土压力系数
应力应变关系
纵横波速度
深度学习方法
参数
测井资料
注意力机制