一种基于分块并行的超大幅面文档智能识别方法及系统

AITNT
正文
推荐专利
一种基于分块并行的超大幅面文档智能识别方法及系统
申请号:CN202510152368
申请日期:2025-02-12
公开号:CN119625766B
公开日期:2025-05-09
类型:发明专利
摘要
本发明提供了一种基于分块并行的超大幅面文档智能识别方法及系统,包括以下步骤:获取待识别文档的图像数据;采用自适应分块策略,根据系统可用内存或者图像特征进行动态分块,相邻块之间保持一定的重叠区域,再将分块任务转化为异步任务队列;使用线程池并行处理各个分块,或者采用分布式计算架构将任务分配到多个计算节点上执行;检测文本区域和表格结构,通过文本识别模型对检测到的文本区域进行文本识别;收集各个分块的处理结果,根据记录的位置信息进行合并;根据文本识别模型输出的识别结果进行置信度打分来优化文本区域,对优化后的文本进行可视化处理和版面分析,生成标准格式的输出结果。
技术关键词
智能识别方法 文本识别模型 分块策略 分布式计算架构 图像数据预处理 标记置信度 坐标 多边形 格式 轮廓 数据接收模块 生成表格 索引 队列
系统为您推荐了相关专利信息
1
一种医学图形影像人工智能识别方法及系统
三维体素模型 人工智能识别方法 病理切片图像 人工智能识别系统 无缝全景
2
一种针对法律文件的自动化分块标注方法
标注方法 分块策略 文档分割方法 语义分割方法 字符分割方法
3
一种温度变送器的故障事件智能识别方法
监测点 绕组部件 智能识别方法 机器学习模型 绕组故障
4
敏感信息的识别方法、装置及电子设备
敏感信息识别 文本识别模型 策略 识别置信度 识别方法
5
一种多功能车载、船载转台相机系统及控制方法
相机控制方法 伺服电机控制系统 坐标 图像数据预处理 像素点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号