摘要
本申请涉及一种基于多视图聚类的检索增强生成方法和系统。所述方法包括:构建图谱数据库、向量数据库和ES数据库;将图谱数据库、向量数据库和ES数据库中的数据进行多视图预处理得到多视图特征数据库,对用户输入的多视图特征和多视图特征数据库中的数据进行多视图聚类得到多个聚类簇和每一数据点的软聚类分数;选取与用户输入属于同一聚类簇的数据点放入候选池,对候选池中的每一数据点对应的原始数据进行多路召回得到召回结果;根据软聚类分数对召回结果进行融合重排得到重排结果,将重排结果和用户输入加载到提示词后输入大语言模型,输出对应的回答。采用本方法能够在保证检索效率的前提下进一步提高检索精度,实现高效文档检索。
技术关键词
特征数据库
图谱
关键字
文本
大语言模型
聚类
生成方法
编码
链接特征
词袋模型
排序模型
模块
嵌入特征
重构
生成系统
拉链
三元组
语义
实体
系统为您推荐了相关专利信息
资产数字化方法
实体
多模态信息
传感器
数据嵌入
风险评价系统
大语言模型
图像识别模块
空气监测设备
采集设备
脚本
分布式计算节点
视频编辑软件
子模块
大语言模型