摘要
本发明涉及自然语言处理技术领域,其特别涉及一种文本知识库的构建方法、计算机设备及程序产品。本发明提供的一种文本知识库的构建方法,通过大语言模型提取原文本的一级标题;基于一级标题对原文本进行切分,获得与一级标题数量对应的一级文本;将不满足预设终止切分条件的一级文本进行并行递进式的切分,直至切分后的子文本满足预设终止切分条件时,停止切分;基于原文本的主标题和切分后的所有一级文本和子文本构建多层次的文本结构树。实现了逐层识别文本结构并递归构建多层次的文本结构树,不仅保留了原文本原有的逻辑层级,还减少了语义割裂与结构混乱的问题,使得各个层级关系清晰可控,有效提升知识组织的严谨性与完整性。
技术关键词
文本
大语言模型
节点
多层次
计算机设备
层级
储存器
计算机程序产品
自然语言
处理器
语义
列表
关系
嵌套
逻辑
标识
组织
指令
系统为您推荐了相关专利信息
停车推荐方法
计算机可读指令
停车位
需求预测模型
数据
智能写作
关键词
数据获取模块
数据处理模块
文本生成方法
生命体征数据
语义
智能护理系统
转换器结构
时序