一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法

正文

推荐专利

申请号：CN202510965089

申请日期：2025-07-14

公开号：CN120808353A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法，属于计算机视觉与光学字符识别（OCR）技术领域；该方法针对弯曲文本检测中传统最小旋转矩形（MRR）拟合不精确的问题，提出动态优化机制：首先通过分割模型获取文本像素级掩码并提取连通组件；对每个组件拟合初始MRR后，构建优先级队列迭代处理；基于交并比（IoU）和尺寸双条件判断，当IoU≤动态阈值τ且短边≥时，沿长边中垂线二分切割生成子矩形；最终对重叠率>70%的相邻框执行融合操作；其中动态阈值τ=τ₀+k·C（弯曲度），通过轮廓点与拟合椭圆平均距离计算弯曲度值C。

技术关键词

后处理方法检测协处理器优先级调度策略文本工业OCR识别矩形 OCR识别模型向量运算单元动态弯曲坐标队列光学字符识别可读存储介质图像采集器存储计算机程序轮廓像素计算机视觉索引

系统为您推荐了相关专利信息

一种基于大语言模型反馈的语言学习评估方法及系统

大语言模型编码子模块文本日志

一种基于记忆驱动的视觉语言导航方法

导航方法记忆指令轨迹图像编码器

一种基于生成式序列帧图像的稀疏视图建筑三维重建方法及装置

序列帧三维重建方法生成三维建筑模型图像模型训练模块

自动驾驶端到端模型自我纠正方法、装置及介质

Agent系统交叉注意力机制纠正方法多模态文本编码器

一种孤独症谱系障碍知识图谱构建方法及系统

孤独症谱系障碍知识图谱构建方法演化机制混合卷积神经网络追踪算法

一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法

站点导航

APP 下载