摘要
本发明提供一种实现复杂情况下图像文本识别方法及系统,涉及计算机视觉和人工智能技术领域,所述方法包括:遍历边缘图的每个边缘点,以梯度方向为搜索路径进行边缘生长,连接生长点形成边缘点对,计算点对间距离作为笔划宽度,将连续生长的边缘点聚合为连通分量;对每个连通分量,沿其矩形轮廓两侧扩展矩形探测区域,将探测区域与已聚合的文本行区域进行重叠比对,筛选有效重叠区域。本发明通过精确的边缘提取和笔划宽度计算,以及有效的文本行生成策略,能够在复杂场景下实现更准确的文本识别。
技术关键词
图像文本识别方法
文本行
生成图像模板
笔划宽度
OTSU阈值
外轮廓尺寸
掩模
文本识别系统
矩形
像素点
可读存储介质
人工智能技术
重叠面积
处理器
计算机视觉
系统为您推荐了相关专利信息
在线批注方法
标记
批注技术
账户验证技术
文档转换技术