摘要
本发明公开了一种智能文献检索系统、方法、电子设备及存储介质,其中方法包括:通过爬虫工具得到引用文章作为外部知识,用于后续检索;将外部知识通过大语言模型进行指代消解操作,并对经过指代消解处理的外部知识进行文本分块,分解为子单元;对每个子单元进行文本的向量化处理,并对得到的文本向量进行降维;对降维后的文本向量进行层次聚类,根据层次聚类结果构建检索树,并通过大语言模型进行检索树中节点的信息合并;在检索过程中,根据用户输入查询的不同需求调整检索树的高度,根据经过调整的检索树进行匹配检索,输出检索结果;本发明解决了现有文献检索系统中指代消解、引用知识的利用以及降维聚类不足的问题。
技术关键词
文献检索系统
大语言模型
文本
文献检索方法
聚类
分块
爬虫
节点
模块
文章
电子设备
解析工具
语法结构
处理器
拉普拉斯
矩阵
标记
页面
语义
可读存储介质
系统为您推荐了相关专利信息
酒店运营管理
动态定价策略
酒店选址
聚类分析算法
计算机可读取存储介质