摘要
本发明公开了一种基于扫描文字边缘颜色偏差的文字智能识别方法,包括以下步骤:步骤一:数据集准备:收集仅含手写体或打印体的单文字图片,将完整文本行切割为单个文字区域,标注类别标签;步骤二:多维度特征提取:对于每一张输入的图片,提取纹理和形态特征以及点云颜色特征;步骤三:模型训练:将纹理和形态特征以及点云颜色特征拼接,形成高维特征向量,利用高维特征向量对随机森林模型进行训练;步骤四:模型应用:将待处理的扫描图片输入到训练好的随机森林模型中,随机森林模型输出手写体和打印体文字区域的划分结果,完成手写与打印文字的分割。
技术关键词
随机森林模型
智能识别方法
高维特征向量
灰度共生矩阵
直方图
颜色
多维度特征提取
局部二值模式
偏差
图片
点云
统计特征
文本行
纹理
形态
图像
样本
像素点
定义