摘要
本发明属于图像处理领域,具体涉及了一种基于文本图像比对的电子文件整理方法,旨在解决现有技术人工核查效率低下,人力成本高昂且易因疲劳导致漏检或误判的问题。本发明包括:分别提取第一图像集和第二图像集中每一个图像的行信息,并对所述第一图像集和第二图像集中每一个图像进行切块操作,生成行对齐的两个待比对图像块集合;将相同顺序的单个图像块进行特征比对,判断第一图像集和第二图像集中相同页的关联性;以第一图像集为基准,遍历第二图像集的每一页,基于关联信息建立页级对应关系,并进行保留、替换、删除或插入的操作,生成与纸质版博硕论文一致的电子版博硕论文。本发明减少了人力成本,提高了检测效率以及准确率。
技术关键词
文件整理方法
图像块
论文
文本
切块
电子
文件整理系统
RANSAC算法
图像转换模块
特征点
关系
计算机
可读存储介质
基准
图像像素
处理器通信
指令
图像处理
系统为您推荐了相关专利信息
深度卷积网络
预训练语言模型
文本分类方法
多层卷积神经网络
深层卷积网络
条目
生成答案
模式识别模型
生成输出数据
关键词
光学补偿方法
图像块
纹理特征
像素
光学补偿设备