摘要
本申请公开了基于结构熵层次知识树的检索增强方法及其系统,通过将层次化聚类HCSE算法与RAG结合,构建多层次逐层细化信息的社区结构,提升答案的准确性和生成效率。该方法具体包括:利用大语言模型LLM对文本数据集和图像数据集进行图构建分别得到相应的图结构,并使用基于结构熵的层次化聚类HCSE算法将得到的图结构直接生成多层次的社区结构并构建层次知识树;利用大语言模型LLM对层次知识树中每一个社区的节点度数和社区密度进行分析生成相应的社区总结并按照信息优先级排序;结合层次知识树中的社区总结,按照顶层社区‑中间层社区‑底层社区的顺序进行层次化检索生成局部答案,通过Map‑Reduce方式对所有的局部答案进行整合生成最终答案。
技术关键词
答案
社区结构
原始图像数据
大语言模型
医学影像数据
节点
中间层
文本
多层次
实体
查询关键词
主题
生成文档
整体健康
算法
患者
电子病历
生成特征
系统为您推荐了相关专利信息
界面组件
非暂时性机器可读存储介质
参数
大语言模型
自然语言
英文PDF文档
文档翻译系统
机器翻译方法
中文文本
大语言模型