摘要
本发明属于数据库增强领域,尤其涉及基于大模型的RAG知识库自动构建方法及系统,首先构建RAG知识库,用户可自定义其图标与名称,同时内置数据嵌入模型及并行检索方式功能模块,配置文本召回测试工具;数据嵌入模型能把非结构化数据转为向量存储于分类向量子数据库;将待检索文档上传至知识库预处理,得到文档文本需求空间,利用分段TopK召回策略及文本召回测试工具,从知识库的向量检索、关键词检索和混合检索等并行检索方式中获取最优有效召回信息片段集,最终依据文档文本需求空间与最优有效召回信息片段集得出有效问答结果,提升知识库的构建效率与问答准确性。
技术关键词
知识库自动构建
文本
测试工具
数据嵌入
分块
关系
分段
序列
参数
功能模块
构建训练集
生成文字
图标
关键词
策略
多形式
语义特征
计算机
系统为您推荐了相关专利信息
智能检索方法
国际商务
多语言
检索算法
查询意图