一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法

AITNT
正文
推荐专利
一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法
申请号:CN202510965089
申请日期:2025-07-14
公开号:CN120808353A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法,属于计算机视觉与光学字符识别(OCR)技术领域;该方法针对弯曲文本检测中传统最小旋转矩形(MRR)拟合不精确的问题,提出动态优化机制:首先通过分割模型获取文本像素级掩码并提取连通组件;对每个组件拟合初始MRR后,构建优先级队列迭代处理;基于交并比(IoU)和尺寸双条件判断,当IoU≤动态阈值τ且短边≥时,沿长边中垂线二分切割生成子矩形;最终对重叠率>70%的相邻框执行融合操作;其中动态阈值τ=τ₀+k·C(弯曲度),通过轮廓点与拟合椭圆平均距离计算弯曲度值C。
技术关键词
后处理方法 检测协处理器 优先级调度策略 文本 工业OCR识别 矩形 OCR识别模型 向量运算单元 动态 弯曲 坐标 队列 光学字符识别 可读存储介质 图像采集器 存储计算机程序 轮廓 像素 计算机视觉 索引
系统为您推荐了相关专利信息
1
一种基于大语言模型反馈的语言学习评估方法及系统
大语言模型 编码 子模块 文本 日志
2
一种基于记忆驱动的视觉语言导航方法
导航方法 记忆 指令 轨迹 图像编码器
3
一种基于生成式序列帧图像的稀疏视图建筑三维重建方法及装置
序列帧 三维重建方法 生成三维建筑模型 图像 模型训练模块
4
自动驾驶端到端模型自我纠正方法、装置及介质
Agent系统 交叉注意力机制 纠正方法 多模态 文本编码器
5
一种孤独症谱系障碍知识图谱构建方法及系统
孤独症谱系障碍 知识图谱构建方法 演化机制 混合卷积神经网络 追踪算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号