一种基于栈机制实现的高效文档切分方法

AITNT
正文
推荐专利
一种基于栈机制实现的高效文档切分方法
申请号:CN202510983731
申请日期:2025-07-17
公开号:CN120995981A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种基于栈机制实现的高效文档切分方法,包括:进行文档预处理,基于标题范式对标题进行筛选和根据栈元素对文档进行分块;其在基于标题范式对标题进行筛选中包括对标题进行等级划分:遍历标题列表之后,逐个判断其标题等级,如随后对标题等级进行确认,并更新所述行的标题等级。本发明将文档按照标题等级来不断划分成不同大小的块,从而能够根据不同文档类型、语言结构以及用户需求,实现高效、准确、语义连贯的文档切分。
技术关键词
元素 列表 机制 文本行 分块 格式化 目录 语义 冗余 变量 对象
系统为您推荐了相关专利信息
1
一种知识图谱实体补全方法
实体 补全方法 三元组 语义 生成自然语言
2
一种单细胞Hi-C图谱插补方法及装置
插补方法 矩阵 图谱 灰度梯度信息 原始测序数据
3
一种3D打印机打印制品外形视觉检测方法
视觉检测方法 表面图像数据 三维点云数据 非瞬时性计算机可读存储介质 打印机
4
核电机器人精准定位与路径规划方法
核电机器人 启发式搜索算法 路径规划方法 节点 能量消耗
5
嵌入式系统的引导程序验证方法、装置、设备及介质
程序验证方法 嵌入式系统 设备身份认证 密钥管理 固件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号