基于聚类的稀疏与密集检索增强生成系统及其方法

AITNT
正文
推荐专利
基于聚类的稀疏与密集检索增强生成系统及其方法
申请号:CN202411589033
申请日期:2024-11-08
公开号:CN119760134A
公开日期:2025-04-04
类型:发明专利
摘要
本发明涉及一种基于聚类的稀疏与密集检索增强生成系统及其方法包括密集知识库的构建模块,用于将文档拆分成固定大小的chunk,并对chunk进行向量化处理,使用K‑means算法对向量化后的chunk进行聚类;密集知识库线向量筛选模块,用于根据用户查询,筛选出与查询相似度高于预设阈值的簇中的向量;稀疏向量引入模块,用于将筛选出的密集向量转换为稀疏向量,以实现字符级别的精确检索。本发明的优点是:通过聚类密集向量的方式缩短了检索的时间,并通过稀疏与密集向量的结合解决实现了准确率更高且完备的RAG系统。
技术关键词
生成系统 聚类 规范化方法 模块 字符 生成方法 算法 代表 日志 文本 效应 编码 标记
系统为您推荐了相关专利信息
1
一种票据识别方法、装置、设备、存储介质及程序产品
图像 文本 票据识别方法 计算机执行指令 视觉
2
基于残差传播与标签平滑的社交机器人检测方法及系统
标签 节点 机器人 预测残差 社交网络安全
3
一种基于自适应卷积的贮箱网格壁板厚度测量方法
网格壁板 厚度测量方法 邻域 厚度计算方法 DBSCAN聚类算法
4
料箱搬运机器人、控制模块、取放货方法及多层货架系统
外门架 货物存储空间 搬运机器人 伸缩门架 多层货架
5
电机堵转保护方法及电路
低侧开关 高侧开关 电机堵转保护方法 电机驱动芯片 逻辑控制单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号