摘要
本发明公开了一种基于树状结构的大模型信息检索方法,属于自然语言处理技术领域。本发明首先使用二分策略对初始文档进行分块,形成大小合适的chunks,并构建一棵二叉树以利于数据传递。接着,本发明从根节点中提取关键信息如摘要、标题和日期等,并将这些信息传递给树中的每个节点。每个叶子节点根据其分块内容和接收到的关键信息生成精确的查询请求,这些查询请求以自底向上的方式合并到根节点。然后,利用基于相似度的混合检索技术,找出相似度最高的前k个节点。最终,将这些节点的分块信息和关键数据输入至大型语言模型以生成答案。本发明提出的信息检索方法有效利用树形结构进行信息传递,优化了文档检索过程。
技术关键词
信息检索方法
树状结构
节点
检索技术
摘要
混合检索方法
日期
文本
分块方法
语义
分块策略
结点
生成答案
查询意图
数据
树形结构
自然语言
系统为您推荐了相关专利信息
多通道
信号处理算法
信号采集模块
数据获取子模块
信号特征
利益分配方法
日志
验证机制
数据采集模块
分布式账本
SMOKE模型
多模型
修正方法
节点
实测气象数据