摘要
本发明提供了一种基于纸质文档数字化转换的数字化档案平台,属于数据处理技术领域,平台包括:扫描采集模块、智能图像预处理模块、深度学习OCR识别模块、语义理解与分类模块、元数据自动提取模块、加密存储与检索模块和版本管理与权限控制模块。本发明通过深度学习OCR识别模块的曲面拟合校正技术,提升复杂场景下(如变形、模糊文档)的文字识别准确率,显著减少人工校对成本。
技术关键词
纸质文档
密钥生成单元
索引
多尺度特征提取
生成加密密钥
多项式
识别模块
控制用户访问权限
语义
校正单元
平台
图像
NURBS曲面
文本
关键词
识别命名实体