摘要
本发明涉及一种基于聚类的稀疏与密集检索增强生成系统及其方法包括密集知识库的构建模块,用于将文档拆分成固定大小的chunk,并对chunk进行向量化处理,使用K‑means算法对向量化后的chunk进行聚类;密集知识库线向量筛选模块,用于根据用户查询,筛选出与查询相似度高于预设阈值的簇中的向量;稀疏向量引入模块,用于将筛选出的密集向量转换为稀疏向量,以实现字符级别的精确检索。本发明的优点是:通过聚类密集向量的方式缩短了检索的时间,并通过稀疏与密集向量的结合解决实现了准确率更高且完备的RAG系统。
技术关键词
生成系统
聚类
规范化方法
模块
字符
生成方法
算法
代表
日志
文本
效应
编码
标记
系统为您推荐了相关专利信息
网格壁板
厚度测量方法
邻域
厚度计算方法
DBSCAN聚类算法
外门架
货物存储空间
搬运机器人
伸缩门架
多层货架
低侧开关
高侧开关
电机堵转保护方法
电机驱动芯片
逻辑控制单元