一种采用自适应动态分块算法的多级分割文档切分方法

AITNT
正文
推荐专利
一种采用自适应动态分块算法的多级分割文档切分方法
申请号:CN202510979371
申请日期:2025-07-16
公开号:CN120951941A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种采用自适应动态分块算法的多级分割文档切分方法,涉及文档切分技术领域,方法包括:确定待切分文档的目标文档类型以及目标章节信息;当目标文档类型为标准文档时,基于目标章节信息计算待切分文档对应的目标信息密度;基于目标信息密度,确定待切分文档对应的目标章节重叠度,根据目标章节重叠度,对每个目标章节进行切分,完成待切分文档的切分处理。本发明确保切分后的文档章节内容完整且逻辑连贯,避免了因盲目切分导致的信息丢失或章节内容割裂等问题,有效提升了文档切分的质量和效率,使得切分后的文档更符合实际使用需求。
技术关键词
分块算法 切分系统 密度 动态 信息熵 电子设备 可读存储介质 处理器 计算机 存储器 模块 基础 关系 逻辑
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号