基于RAG和多模态知识图谱的文档智能解析与问答方法及系统

正文

推荐专利

申请号：CN202510960345

申请日期：2025-07-11

公开号：CN120705275A

公开日期：2025-09-26

类型：发明专利

摘要

基于RAG和多模态知识图谱的文档智能解析与问答方法及系统，本发明为解决现有的GraphRAG主要依赖于文本检索和生成，缺乏对图像或其他模态信息的利用，在复杂的应用场景中，导致回答的全面性和准确性受限的问题。解析多模态文档得到文本模态信息和图像模态信息；将文本模态信息转换成文本知识图谱，将图像模态信息转换成图像知识图谱；将文本知识图谱和图像知识图谱进行融合，得到多模态知识图谱；将多模态知识图谱依次输入嵌入模型和向量数据库，得到实体向量数据库。将用户的待查询问题依次输入嵌入模型和向量数据库内，得到待查询问题对应的信息，将待查询问题对应的信息输入大语言模型内，输出待查询问题的答案。本发明属于数据处理领域。

技术关键词

多模态文本实体提取技术问答方法子模块知识图谱构建实体间关系谱聚类方法大语言模型问答系统开源工具节点 DBSCAN聚类算法图像分割跨模态元素

基于RAG和多模态知识图谱的文档智能解析与问答方法及系统

站点导航

APP 下载