摘要
本发明公开了一种采用自适应动态分块算法的多级分割文档切分方法,涉及文档切分技术领域,方法包括:确定待切分文档的目标文档类型以及目标章节信息;当目标文档类型为标准文档时,基于目标章节信息计算待切分文档对应的目标信息密度;基于目标信息密度,确定待切分文档对应的目标章节重叠度,根据目标章节重叠度,对每个目标章节进行切分,完成待切分文档的切分处理。本发明确保切分后的文档章节内容完整且逻辑连贯,避免了因盲目切分导致的信息丢失或章节内容割裂等问题,有效提升了文档切分的质量和效率,使得切分后的文档更符合实际使用需求。
技术关键词
分块算法
切分系统
密度
动态
信息熵
电子设备
可读存储介质
处理器
计算机
存储器
模块
基础
关系
逻辑