摘要
本发明公开了一种针对含表格文档的智能问答方法及系统,所述方法首先获取文档,对文档进行数据预处理,得到预处理后的表格D和文本数据F。其次通过大语言模型,对表格数据进行处理,分别得到表格节点和表格实体节点。然后将文本数据F按照段落进行切割,对每一段文本通过嵌入大语言模型B生成嵌入,生成文本节点,基于文本节点、表格节点和表格实体节点,通过递归构建知识图谱。最后根据知识图谱,基于迭代检索优化用户查询和最大化检索信息;将相关文本和用户查询,构建为结构化信息返回给大模型M,生成回答。本发明能够更好的处理多种形式的文档,在进行针对含表格文档的智能问答时精度更高。
技术关键词
智能问答方法
大语言模型
节点
构建知识图谱
DBSCAN聚类算法
实体
生成表格
表格数据处理
Canny算法
摘要
文本检测模型
智能问答系统
表头
树状知识
知识图谱构建
高斯滤波器
系统为您推荐了相关专利信息
隐私保护方法
大语言模型
命名实体识别方法
通信效率
参数
视频剪辑方法
视频剪辑系统
兴趣
注意力
梯度下降法