摘要
本发明为一种基于UNet算法的面向文本线段检测方法,具体过程是:获取带线段文本图像数据;对采集的图像进行尺寸归一化处理,利用标注工具labelme对图像进行人工标注,获取线段位置,并扩充为宽度为两个像素点的矩形,获取矩形四点的坐标,再对图像进行二值化处理,生成二值化标签图像,得到目标检测数据集;二值化标签图像中标注原始图像中所有线段所在位置;基于UNet算法构建线段检测网络模型,以目标检测数据集训练线段检测网络模型,以训练好的线段检测网络模型对文本图像中线段进行预测,输出模型预测图;对模型预测图进行后处理,提取文本图像中横向线段、纵向线段、斜向线段的位置,实现在文本图像中线段的检测,提高了文本线段的检测精度。
技术关键词
检测网络模型
图像
线段检测方法
文本
生成二值化
像素点
坐标
解码器
标注工具
标签
算法
矩形
线条
数据
标记
可读存储介质
上采样
轮廓
系统为您推荐了相关专利信息
磁敏感加权成像
双输入通道
自动识别方法
图像
变换算法
膝关节骨关节炎
自然语言文本
决策树系统
数据接收模块
数据处理模块
鞋底边缘
轮廓曲线
鞋底形状
线跟踪方法
轮廓数据