摘要
本发明涉及自动化办公技术领域,具体为一种纸质表单数据智能识别与存储方法及系统,其中方法包括以下步骤:使用图像采集设备获取纸质表单图像;对表单图像预处理;通过多模型融合OCR识别框架识别表单图像中各数据项,识别后基于行业知识与语义建模智能纠错,用识别出内容构建结构化映射模型,模型关联表单上二维码形成表单识别模版;通过扫码调取特定识别模版,根据模版,表单数据直接按几何位置确定所属数据库,按数据项语义标签创建库中表名及字段名,实现对识别结果的智能化快速存储,采用滑动定位机制持续校正数据在表单中的位置坐标。本发明具备自学习优化能力,可适应恶劣工作环境,可实现持续升级与新场景扩展,具有实用价值和推广前景。
技术关键词
数据项
语义标签
纸质表单
数据智能识别
图像采集设备
模版
存储方法
自动化办公技术
二维码
拍照设备
坐标
空间邻近关系
构建数据结构
语义分类器
高分辨率相机
语义特征
恶劣工作环境
系统为您推荐了相关专利信息
变电站智能设备
语义标签
解析方法
语义规则
逻辑
深度学习模型
肉鸡
特征提取单元
金字塔网络
识别方法
三维点云数据
三维点云分割
对象
标注方法
语义标签