摘要
本申请提供了一种文本的处理方法、装置、电子设备、存储介质及程序产品;方法包括:将文本文档转换成网页文件,网页文件包括第一标签,第一标签与文本文档中的文本一一对应;基于文本文档的目录,构建目录中标题项和标题项的层级之间的映射关系;基于映射关系,对第一标签进行分组,得到多个标签组;基于标签组对文本文档进行分段,得到多个子文本。通过本申请,能够有效提升文本文档的分段效率。
技术关键词
标签组
文本
计算机可执行指令
分段
层级
目录
关系
电子设备
计算机程序产品
处理器
语义
可读存储介质
存储器