一种基于树形结构和语义感知的结构化文档知识库构建方法、系统、设备及介质

AITNT
正文
推荐专利
一种基于树形结构和语义感知的结构化文档知识库构建方法、系统、设备及介质
申请号:CN202510639110
申请日期:2025-05-19
公开号:CN120179676A
公开日期:2025-06-20
类型:发明专利
摘要
本发明涉及检索增强生成技术领域,具体地说,涉及一种基于树形结构和语义感知的结构化文档知识库构建方法、系统、设备及介质;对结构化文档知识库构建进行改进,首先调用Python工具将获取的文档解析为树结构;然后根据语义理解,将树结构中的节点文本内容进行动态切片,得到具备完整语义的文本块;最后根据文本块生成文档元数据,构建结构化文档知识库;不仅提升了结构化文档检索结果的精确度和生成质量,还解决了传统RAG系统难以实现的文档内容精准溯源问题,显著提高了系统的可信度。
技术关键词
知识库构建方法 树形结构 动态切片 文本 语义理解模型 生成文档 结构化文档检索 逻辑回归模型 预训练模型 自然语言 Sigmoid函数 电子设备上执行 解析单元 随机梯度下降 可读存储介质 生成答案 存储计算机程序 节点
系统为您推荐了相关专利信息
1
图像生成方法、装置、电子设备及介质
边缘轮廓图 编码 图像生成方法 人物模型 大语言模型
2
针对中文麻醉数据集不平衡的解决方法及装置
焦点损失函数 预训练模型 GCN模型 风险 标签特征
3
基于思维链标注的增强决策方法、装置、设备及介质
决策方法 生成结构化数据 融合特征 实时数据监测 多模态
4
基于超图神经网络结合文本的信息传播预测方法及系统
信息传播预测方法 文本特征向量 级联 融合全局 信息传播预测系统
5
多模态文档理解方法及装置、电子设备
大语言模型 文本检测模型 数据 理解技术 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号