摘要
本发明公开了一种图像文本提取方法、装置、设备、介质及程序产品,本发明涉及图像识别技术领域。该方法包括:基于像素分类阈值,将待识别图像中的像素点分为背景像素点和文字像素点;对待识别图像中的像素点进行逐行扫描,根据每行像素点中背景像素点的数量,将待识别图像分割为多行文本;对每行文本进行逐列扫描,根据每列像素点中背景像素点的数量,对每行文本进行文本块分割;针对待识别文本块,在多个预设方向上获取文字像素点的分布数据,并根据分布数据构建待识别文本块的特征向量;将待识别文本块的特征向量,与文本库中标准文本的标准特征向量进行比对,确定待识别文本块对应的文本。本发明的技术方案,降低了文本提取的计算成本。
技术关键词
识别文本块
像素点
像素分类阈值
文本提取方法
高维特征向量
图像分割
文本提取装置
坐标系
横轴
图像识别技术
数据
处理器
计算机程序产品
文本识别
文本行
纵轴
模块
可读存储介质