摘要
本申请公开了一种文本评查方法及其系统,文本评查方法包括以下步骤:获取文档;判断文档是否为可以解析的文档;若文档不可以解析,则对获取的文档进行图片转换,并进行版面分析处理;完成版面分析处理后,判断是否包含表格;若包含表格,则进行表格识别处理,完成表格处理后进行文本检测识别处理;若不包含表格,则直接进行文本检测识别处理;根据文本检测识别处理结果,进行综合定位;完成综合定位后进行文本评查。本申请运用大模型,计算机视觉等人工智能技术对获取的文档进行全自动,准确,高效识别,极大的提升了信息采集效率,解决了当前人工识别文档方式中资源投入量大、管理效率低、工作强度高的问题。
技术关键词
表格
文本行
解析单元
定位单元
图片
文本识别
分析单元
坐标
人工智能技术
计算机视觉
资源
强度