摘要
本发明公开了一种针对非结构化文档的知识库构建方法、系统及一种大模型问答方法、系统。该方法获取非结构化文档,划分文档区域;解析所述文档区域得到非结构化文档信息;利用启发式规则处理所述非结构化文档信息,得到初始文本;校对并修改所述初始文本,得到最终文本;向量化所述最终文本,得到最终文本向量;将对应的最终文本向量与最终文本作为知识库条目,保存为数据库。该方法可以简单高效地处理非结构化文档并构建知识库,进而提升大语言模型问答系统的准确性。
技术关键词
非结构化文档
知识库构建方法
启发式规则
文本
问答方法
条目
生成答案
问答系统
模块
大语言模型
构建系统
间距
数据
坐标
系统为您推荐了相关专利信息
数字孪生系统
查询系统
质谱仪设备
输入模块
文本
数据管理方法
数据治理系统
数据采集策略
深度学习方法
数据资源优化
辅助分析方法
大语言模型
风险
图谱
地质勘探资料
资源
显示虚拟对象
计算机可执行指令
元素
计算机程序产品