摘要
本发明提供了一种基于深度学习的文档图像矫正判别方法,属于计算机视觉领域,包括:对获取的文档图像进行四点检测,获取角点坐标信息,对文档图像中的背景区域进行去除,获取预处理文档图像;基于文本检测分割算法对预处理文档图像进行文本行分割,获取文本行掩膜图像;获取文本行掩膜图像的最大外接矩形,进行裁剪和骨架提取,获取骨架外接矩形,判断文本行掩膜图像的扭曲情况,获取文本行矫正判别信息;根据所有文本行对应的文本行矫正判别信息,进行预处理文档图像的矫正判别,执行相应的图像矫正操作。上述技术方案在对文档图像判别为扭曲图像时,再进行图像矫正处理,降低文档图像矫正技术的成本消耗,以保证对文档图像的高效矫正处理。
技术关键词
文本行
判别方法
文档特征
样本
坐标
特征提取网络
非线性特征提取
掩膜
归一化模块
矩形
降维特征
透视变换矩阵
分割算法
像素点
图像矫正技术
深度卷积特征
系统为您推荐了相关专利信息
医学图像分割模型
医学图像分割方法
掩膜
分割医学图像
样本
荧光光谱分析方法
三维荧光光谱
无监督
信号源
独立成分分析
分割方法
计算机可读指令
染色
图像
canny算法
网络流量数据集
生成对抗网络
样本
过采样技术
高斯分布模型