摘要
本发明公开了一种基于AI分类的单/多页文件混合扫描自动合并的方法,该方法具体包括如下步骤:S1,构建AI分类模块;S2,将打标签后的影像数据进行训练数据和测试数据的划分;S3,通过OCR技术将训练集和测试集的影像文件数据转化为文本数据;S4,利用FastText分类算法建立FastText模型,并训练出对应的文本分类模型;S5,扫描仪对放入的附件文本进行扫描获取附件的影像数据;S6,AI分类模块中的文本分类模型对影像数据进行识别判断影像数据为单页数据或多页数据,并对识别的影像数据进行储存。本发明通过文本分类模型的设置,在文件扫描阶段自动完成附件的识别扫描和合并储存工作,提高了文件扫描的效率。
技术关键词
文本分类模型训练
判断影像数据
附件
单据
扫描仪
加速模型训练
数据打标签
储存服务器
模块
二维码
采样技术
队列
算法
关键词
系统为您推荐了相关专利信息
模型自动生成方法
三维BIM模型
语义分割神经网络
BIM构件
点特征直方图
门楣
不锈钢螺栓
不锈钢挂件
板材
三维激光扫描仪
空间可重构
影像采集模块
纹理特征提取
软组织结构
多模态