摘要
本发明提出的一种RAG知识库的检索性能提升方法、系统、装置及介质,所述方法包括:获取知识文档,提取其中的文本信息,并对文本信息进行预处理;根据文本层次结构利用大语言模型框架将文本信息进行拆分为文本块;利用中文向量大模型对拆分后的文本块进行向量化处理,并生成文本块的语义相似度矩阵;根据文本块的语义相似度矩阵对文本块进行合并处理,生成组合后的文本块;将组合后的文本块信息存入向量数据库。本发明通过在从文本到向量数据库存储之间对细碎的文本内容根据语义进行合并,从而有效的提升了RAG知识库的检索性能。
技术关键词
性能提升方法
语义
大语言模型
矩阵
性能提升装置
文本处理器
信息存储模块
可读存储介质
框架
提升系统
程序
冗余
字体
字符
符号
存储器
系统为您推荐了相关专利信息
机器学习算法模型
恢复方法
ICMP协议
深度强化学习模型
链路
面制品
多模式传感器
Apriori算法
DNN模型
SVM算法
物联网技术
数据收集模块
矩阵
场景
智能加药系统
配电变压器
分布式电源
线损计算方法
配电网模型
配电网线损
门禁管控系统
碳排放测算模型
车牌识别模型
车辆
字符识别