摘要
本发明公开了一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法,属于计算机视觉与光学字符识别(OCR)技术领域;该方法针对弯曲文本检测中传统最小旋转矩形(MRR)拟合不精确的问题,提出动态优化机制:首先通过分割模型获取文本像素级掩码并提取连通组件;对每个组件拟合初始MRR后,构建优先级队列迭代处理;基于交并比(IoU)和尺寸双条件判断,当IoU≤动态阈值τ且短边≥时,沿长边中垂线二分切割生成子矩形;最终对重叠率>70%的相邻框执行融合操作;其中动态阈值τ=τ₀+k·C(弯曲度),通过轮廓点与拟合椭圆平均距离计算弯曲度值C。
技术关键词
后处理方法
检测协处理器
优先级调度策略
文本
工业OCR识别
矩形
OCR识别模型
向量运算单元
动态
弯曲
坐标
队列
光学字符识别
可读存储介质
图像采集器
存储计算机程序
轮廓
像素
计算机视觉
索引
系统为您推荐了相关专利信息
序列帧
三维重建方法
生成三维建筑模型
图像
模型训练模块
Agent系统
交叉注意力机制
纠正方法
多模态
文本编码器
孤独症谱系障碍
知识图谱构建方法
演化机制
混合卷积神经网络
追踪算法