摘要
本发明涉及大语言模型技术领域,具体为一种针对结构化长文档的问答方法,包括以下步骤:S1、解析不同格式的文档,根据解析结果构建文档的结构化元数据;S2、将文档划分成多个文本片段,对每个文本片段进行向量化处理,并存储在专用的向量数据库中;S3、分别构建多个文本内容获取工具,用于提取文档中不同部分的文本内容;设计并实现基于向量的检索工具,用于在向量数据库中查找与用户查询相关的文本片段;S4、构建包含多个文本内容获取工具和检索工具的Agent,针对用户问题智能选择文本内容获取工具或检索工具以获取LLM回答问题所需要的相关文本内容;S5、在获取相关文本内容后,通过LLM通过对相关文本内容进行分析,生成最终回答。
技术关键词
文本
问答方法
表格
页面
语义
图像
格式
生成答案
大语言模型
问答系统
标识
框架
层级
数据
表头
序列
定义
字体
样式
系统为您推荐了相关专利信息
随机森林模型
数据血缘关系
特征选择
表格
存储计算机程序
知识图谱问答系统
知识图谱问答方法
油气
查询意图
命名实体识别模型
复合检测机制
动态语义分析
行业知识图谱
数据格式
数据安全
SQL语法
语句
关系型数据
设计系统
电数字数据处理技术