摘要
本发明提供了一种基于知识图谱和大模型的智能表格问答方法及系统,包括:通过OCR模型和VL模型的组合方式识别表格;决定是否需要VL模型优化转化结果;以属性图的形式存储于图数据库中;将表格的结构信息单独抽取并存储,同时将数据冗余存储在向量数据库中;将用户的自然语言问题转化为图数据库查询语句,并执行查询语句进行数据召回;调用大模型生成最终的问题答案。本发明通过OCR模型和视觉语言模型的组合识别策略,配合基于CLIP模型的质量判断机制,能够准确识别包含多级表头、合并单元格等复杂结构的表格,有效解决了传统方法在复杂表格识别上的准确率低、数据丢失等问题。
技术关键词
表格
问答方法
数据库查询语句
关系型数据库
数据冗余
语义向量
子模块
节点
表头
答案
合并单元格
构建知识图谱
知识图谱构建
自然语言
特征提取模型
实体
系统为您推荐了相关专利信息
异构数据采集方法
施工现场
数据采集系统
关系型数据库
汇聚节点