摘要
本发明公开一种基于字频的文档图像分类方法,涉及文档图像分类技术领域,包括文档图像注册和未知类型的待分类文档图像分类两个步骤。本发明每种文档图像只需要一张样本(即示例文档图像)即可完成文档图像注册,特别的,对于表格类型的文档图像,只需要一张空白的表格即可;提升对各种原因造成的文本行检测算法的错误(误报和漏报)的鲁棒性;提升对各种原因造成的文本行识别算法的错误(误识和漏识)的鲁棒性;能适应增加新的文档图像类型。
技术关键词
文档图像分类方法
文本行
分类程序
图像分类装置
文档图像分类技术
显示文档图像
字符
控制显示器
鲁棒性
识别算法
处理器通信
存储器
表格
可读存储介质
逻辑
计算机
标签