一种基于协同文档树重构的检索方法

AITNT
正文
推荐专利
一种基于协同文档树重构的检索方法
申请号:CN202511517322
申请日期:2025-10-22
公开号:CN120994759B
公开日期:2026-01-02
类型:发明专利
摘要
本申请提供一种基于协同文档树重构的检索方法,以每个文档块的向量表示作为多维系统文档树的第一层节点,对节点执行GMM聚类,结合LLM获取的聚类中心的结构化摘要作为文档树的下一层节点;依照每个文档块的向量表示和树中其它节点之间的层级关系和/或路径距离,基于五元训练样本增强Embedding模型和重排Reranker模型;基于查询文本的待检索向量表示与树中除根节点之外的节点间的第一余弦相似度,得到全局候选文本集;逐层剪枝遍历文档树的节点,获取遍历到的节点与待检索向量的相似度,得到精细候选文本集;采用增强后的Reranker模型对全局候选文本集和精细候选文本集的并集进行重排,得到检索结果。
技术关键词
节点 样本 聚类 摘要 文本 后验概率 协方差矩阵 层级 检索方法 计算机可读指令 语义 高斯混合模型 关系 EM算法 大语言模型 重构 滑动窗口 动态 存储器 处理器
系统为您推荐了相关专利信息
1
确定应用安全性的方法、电子设备和计算机可读存储介质
机器学习模型 序列 可读存储介质 电子设备 手机
2
基于工作流编排的金融图像生成方法、装置、设备及介质
金融 图像生成方法 工作流 编辑 图像生成装置
3
一种无人机网络的弹性抗毁路由方法及其相关设备
中继节点 源节点 备份 构建无人机 邻居
4
积水识别方法、装置、设备及介质
积水识别方法 图像 样本 相机 轮廓
5
基于语义分割的域内建模复制移动篡改检测方法
篡改检测方法 图像边缘检测算法 对象 语义分割方法 图像篡改检测技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号