摘要
本发明提供了一种基于分块并行的超大幅面文档智能识别方法及系统,包括以下步骤:获取待识别文档的图像数据;采用自适应分块策略,根据系统可用内存或者图像特征进行动态分块,相邻块之间保持一定的重叠区域,再将分块任务转化为异步任务队列;使用线程池并行处理各个分块,或者采用分布式计算架构将任务分配到多个计算节点上执行;检测文本区域和表格结构,通过文本识别模型对检测到的文本区域进行文本识别;收集各个分块的处理结果,根据记录的位置信息进行合并;根据文本识别模型输出的识别结果进行置信度打分来优化文本区域,对优化后的文本进行可视化处理和版面分析,生成标准格式的输出结果。
技术关键词
智能识别方法
文本识别模型
分块策略
分布式计算架构
图像数据预处理
标记置信度
坐标
多边形
格式
轮廓
数据接收模块
生成表格
索引
队列
系统为您推荐了相关专利信息
三维体素模型
人工智能识别方法
病理切片图像
人工智能识别系统
无缝全景
标注方法
分块策略
文档分割方法
语义分割方法
字符分割方法
监测点
绕组部件
智能识别方法
机器学习模型
绕组故障
敏感信息识别
文本识别模型
策略
识别置信度
识别方法
相机控制方法
伺服电机控制系统
坐标
图像数据预处理
像素点