基于文档标题层级结构的文档内容切分方法、装置及设备

AITNT
正文
推荐专利
基于文档标题层级结构的文档内容切分方法、装置及设备
申请号:CN202410815757
申请日期:2024-06-24
公开号:CN118734795A
公开日期:2024-10-01
类型:发明专利
摘要
本发明实施例公开了一种基于文档标题层级结构的文档内容切分方法、装置及设备。该方法包括:获取待切分文档,并识别待切分文档中的文档名称、各层级文档标题、以及文档段落;根据各文档段落在文档中所处的章节位置,确定与各文档段落对应的文档标题集;根据待切分文档的上一切分结果、当前文档段落以及下一文档段落,确定当前文档段落是否满足预设切片条件;若是,则更新当前文档段落以及下一文档段落继续判断;若否,则根据上一切分结果至当前文档段落的上一文档段落之间的段落内容,及对应的文档标题集,生成当前切分结果。该方法切分方式简便、可以保证切分片段的语义完整性,最大程度保留语义信息,有利于快速确定切分结果的语义。
技术关键词
表格 层级 切片 切分装置 可读存储介质 计算机 语义 电子设备 处理器通信 识别模块 图片 存储器 指令
系统为您推荐了相关专利信息
1
图像处理方法、电子设备、芯片系统及计算机程序产品
图像处理方法 计算机程序产品 芯片系统 计算机程序代码 电子设备
2
视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法
视频生成模型 视频生成方法 计算机可执行指令 图像 视觉特征提取
3
多模态水下生物入侵检测方法及装置
网格 生成对抗网络 模态特征 声学设备 图像设备
4
一种多直流送端电网稳定控制方法及相关装置
电网稳定控制方法 线路 功率 输入电力系统 智能体模型
5
多链路自适应调度及传输方法、装置、设备及存储介质
链路 负载均衡策略 层级 传输方法 无线通信技术技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号