一种基于最小凸包及弗雷歇距离的bbox合并算法

AITNT
正文
推荐专利
一种基于最小凸包及弗雷歇距离的bbox合并算法
申请号:CN202510641118
申请日期:2025-05-19
公开号:CN120510618A
公开日期:2025-08-19
类型:发明专利
摘要
本发明公开了一种基于最小凸包及弗雷歇距离的边界框(bbox)合并算法,属于图像识别与文本处理技术领域。针对OCR系统中因文本换行或排版复杂导致的多个bbox错误拆分问题,本发明通过以下步骤实现精准合并:首先,动态配置滑动窗口以捕获目标bbox集合,利用QuickHull算法生成其最小凸包图形;其次,计算该凸包与预设标准图形(如三角形、四边形)的弗雷歇距离,结合x轴投影重叠长度阈值判定语义关联性;最终对符合条件的bbox进行纵向合并,并基于坐标均值或边界极值生成新坐标。本发明突破传统行间距依赖,通过几何相似性匹配提升合并准确性,尤其适用于医学检验报告、财务报表等复杂排版文档的OCR处理,有效解决字段信息失真问题。
技术关键词
合并算法 滑动窗口 医学检验报告 文本处理技术 OCR系统 图像识别系统 排版文档 超参数 坐标点 四边形 文本行 三角形 处理器 可读存储介质 存储器 六边形
系统为您推荐了相关专利信息
1
一种针对噪声的新型端到端旋转机械故障诊断框架
旋转机械故障诊断 框架 注意力 噪声 多尺度特征
2
用于视觉障碍者导航辅助的障碍物检测方法和可读介质
障碍物检测方法 检测障碍物 计算机可执行指令 网络 视觉
3
基于PCA-RBF神经网络与时空融合的湖库水华预测预警系统及方法
RBF神经网络 预测预警系统 预测预警方法 皮尔逊相关系数 ARIMA模型
4
一种基于大模型的知识问答方法、装置、设备及存储介质
知识问答方法 答案 词嵌入向量 编码向量 策略
5
保单反欺诈检测方法和装置、电子设备及存储介质
反欺诈 样本 数据 时序特征 主节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号