摘要
本发明涉及化工企业知识库构建方法、装置、电子设备及存储介质,该方法包括:获取化工企业的文档数据集合,并将文档数据集合整理为独立的知识单元。通过大语言模型的嵌入机制将每个文档数据映射至高维向量空间,以生成嵌入向量,并基于嵌入向量及其对应的文档标识存储至向量数据库中。调用嵌入函数将用户输入的自然语言查询文本转化为高维查询向量,并通过向量相似性度量计算高维查询向量与向量数据库中每个嵌入向量之间的相似性得分,以选取相似性得分超过第一阈值的关联文档数据。将自然语言查询文本和关联文档数据的上下文拼接为RAG生成模型的输入,通过大语言模型生成答案,并基于生成的答案结合关联文档数据构建知识库。
技术关键词
知识库构建方法
大语言模型
自然语言
高维向量空间
生成答案
文本
度量
多层注意力
表达式
电子设备
计算机存储介质
标记
数据存储模块
标识符
存储结构
注意力机制
系统为您推荐了相关专利信息
自动开发方法
自然语言
生成前端代码
人工智能模型
大语言模型