摘要
本申请涉及文件管理领域,公开了一种文档数字化处理方法、装置、设备和存储介质。该方法包括:获取纸质文档的图像数据,基于字符识别算法,提取图像数据中的文字信息;若确定文字信息中包含数字,则筛选出用于满足计算需求的目标数字;基于预设的计算公式,对目标数字进行计算,得到计算结果,并将计算结果以预设方式进行显示;根据文字信息,生成电子文档。本申请在对纸质文档进行数字化时,能够根据预设的计算公式对文档中的数字进行计算,使得该文档数字化过程并不仅限于图像或文本的转换,还涉及对其中包含的数据进行提取和计算,增强了数字化后的文档的应用价值,同时也提高了文档管理和利用的效率。
技术关键词
生成电子文档
字符识别算法
表达式
变量
纸质文档
错误检测
格式
图像
计算机设备
数据
计算机存储介质
处理器
识别模块
存储器
策略
关系
文本
定义
系统为您推荐了相关专利信息
异常信息
高效收集方法
捕获机制
机器学习算法分析
动态跟踪技术