摘要
本申请公开一种基于多模态知识融合增强的问答方法和装置,方法包括,将输入的第一文档数据转换成超文本标记语言格式的第二文档数据,第一文档数据和第二文档数据具有不同格式,第一文档数据包括文本数据、图片数据和表格数据中至少两种数据;解析第二文档数据,得到第三文本数据;利用大语言模型识别第三文本数据的上下文关联信息,并根据上下文关联信息将第三文本数据拆分为多个第三上下文分块;对多个第三上下文分块进行向量化处理,得到第三文本数据对应的第三文本向量,并将第三文本向量和第三文本数据存入文档向量数据库,以利用文档向量数据库存储的第三文本数据和第三文本向量进行文档问答。
技术关键词
大语言模型
溯源数据
表格
超文本标记语言
图片
语句
问答方法
答案
多模态
分块
格式
关键词
表头
解析单元
问答装置
处理单元
转换单元
标识
系统为您推荐了相关专利信息
大语言模型
网络安全基线
载荷
测试方法
沙箱环境