摘要
本发明提供一种复杂文档的目录自动生成方法,所述方法包括以下步骤:步骤S1:在预设框内设定各级标题的参数配置,步骤S2:对全篇文档进行文字识别,根据预设框中设定的参数配置,对识别出的文字进行特征匹配,将符合一级标题属性的文本段落抽取出来,生成多个一级文本集;步骤S3:对每个一级文本集内部进行文字识别检索,提取一级标题,并将符合二级标题属性的文本段落抽取出来,生成多个二级文本集,以此规则逐层生成三级文本集及四级文本集并从中提取对应的二级标题和三级标题并标记;步骤S4:将所提取的一级标题、二级标题、三级标题按照预设规则和标题层级生成初始目录文本;步骤S5:对生成的初始目录文本进行修正,生成最终的目录文本。
技术关键词
自动生成方法
节点
目录
文本段落
层级
检测网络模型
排序算法
参数
标记
标签
字体
样式
列表
元素
关系
系统为您推荐了相关专利信息
细胞图像分类方法
多模态特征
生物
画像
构建分类模型
数据安全防护系统
物联网节点
数据完整性检测
身份认证模块
数据传输策略