摘要
本发明实施例公开了一种基于文档标题层级结构的文档内容切分方法、装置及设备。该方法包括:获取待切分文档,并识别待切分文档中的文档名称、各层级文档标题、以及文档段落;根据各文档段落在文档中所处的章节位置,确定与各文档段落对应的文档标题集;根据待切分文档的上一切分结果、当前文档段落以及下一文档段落,确定当前文档段落是否满足预设切片条件;若是,则更新当前文档段落以及下一文档段落继续判断;若否,则根据上一切分结果至当前文档段落的上一文档段落之间的段落内容,及对应的文档标题集,生成当前切分结果。该方法切分方式简便、可以保证切分片段的语义完整性,最大程度保留语义信息,有利于快速确定切分结果的语义。
技术关键词
表格
层级
切片
切分装置
可读存储介质
计算机
语义
电子设备
处理器通信
识别模块
图片
存储器
指令
系统为您推荐了相关专利信息
图像处理方法
计算机程序产品
芯片系统
计算机程序代码
电子设备
视频生成模型
视频生成方法
计算机可执行指令
图像
视觉特征提取
电网稳定控制方法
线路
功率
输入电力系统
智能体模型
链路
负载均衡策略
层级
传输方法
无线通信技术技术