摘要
本发明公开了一种基于最小凸包及弗雷歇距离的边界框(bbox)合并算法,属于图像识别与文本处理技术领域。针对OCR系统中因文本换行或排版复杂导致的多个bbox错误拆分问题,本发明通过以下步骤实现精准合并:首先,动态配置滑动窗口以捕获目标bbox集合,利用QuickHull算法生成其最小凸包图形;其次,计算该凸包与预设标准图形(如三角形、四边形)的弗雷歇距离,结合x轴投影重叠长度阈值判定语义关联性;最终对符合条件的bbox进行纵向合并,并基于坐标均值或边界极值生成新坐标。本发明突破传统行间距依赖,通过几何相似性匹配提升合并准确性,尤其适用于医学检验报告、财务报表等复杂排版文档的OCR处理,有效解决字段信息失真问题。
技术关键词
合并算法
滑动窗口
医学检验报告
文本处理技术
OCR系统
图像识别系统
排版文档
超参数
坐标点
四边形
文本行
三角形
处理器
可读存储介质
存储器
六边形
系统为您推荐了相关专利信息
障碍物检测方法
检测障碍物
计算机可执行指令
网络
视觉
RBF神经网络
预测预警系统
预测预警方法
皮尔逊相关系数
ARIMA模型