摘要
本发明涉及计算机应用领域,公开了一种文档格式的处理方法、设备及存储介质。该处理方法包括:对初始文档进行预处理,得到预处理文档;创建多个线程处理预处理文档;分析预处理文档的版面信息;识别版面信息中不同类型的区域,提取多个区域中的目标元素;对目标元素进行识别解析处理,得到目标元素的格式信息;将预制的格式模板中的格式信息传递覆盖目标元素的格式信息,得到输出文档。在本发明实施例中,通过对初始文档进行预处理、版面分析、以及目标元素的识别、分类、解析,得到所述目标元素的格式信息,将格式模板中的格式信息传递覆盖所述目标元素的格式信息,得到输出文档,采用多线程并行处理提高了系统处理文档格式的效率。
技术关键词
格式模板
卷积神经网络算法
元素
多线程并行处理
可读存储介质
关系
存储器
处理器
计算机
哈希表
冗余
指令
数据
线路
动态
系统为您推荐了相关专利信息
高速飞行器
节点
通信链路
空间聚类算法
发射天线