摘要
本发明公开了一种基于大数据的图像处理优化系统及方法,涉及图像处理技术领域,传统的图像处理技术在处理破损或污渍遮挡的文献书页时,往往无法完整提取其中的文字内容,从而造成了图像处理系统故障运行,而本发明通过精心设计的模糊区域判断单元,可以检测书页中存在的模糊区域,并且可以准确识别并去除图像中的模糊区域;同时,本发明通过字符提取模块中包含的字符间距计算单元、行间距计算单元和字号计算单元,能够准确的测量并提取文字区域中的字符信息,这些信息被传递给字符排版模块,用于按照原文格式对提取的字符进行精确排版。
技术关键词
像素点
字符
大数据
图像采集设备
图像处理工具
图像采集单元
图像处理软件
书页
图像采集模块
排版
图像分割算法
样本
边缘检测算法
图像处理技术
符号
特征提取技术
通道