摘要
本发明属于大语言模型及信息检索领域,公开了一种支持检索增强生成的知识库构建方法及装置,该方法应用于检索增强生成系统,该系统包括概念层和语义层,该方法包括:获取用于构建知识库的源数据,并通过概念层提取源数据包括的多个概念;通过语义层对多个概念进行概念处理,得到语义层处理后的概念;概念处理包括:概念过滤、概念纠错、概念增强和概念多样化;将语义层处理后的概念转化成向量,并将转化所得的向量存储到向量数据库,得到支持检索增强生成的知识库。本发明将源数据和知识库进行分离,通过概念层和语义层,从源数据提取概念并对概念处理,可以降低知识库的数据冗余度,提高知识库的数据准确性和专业度,并拓宽知识库的数据内容。
技术关键词
概念
语义
知识库构建方法
生成系统
数据
纠错
终端显示界面
生成自然语言
指令
电子设备
答案
处理器
可读存储介质
大语言模型
计算机程序产品
信息检索
冗余度