摘要
一种基于汽车配件领域的知识库应答方法、系统及介质,其包括:获取所有源文档,并通过大语言模型或版面分析模型对每一源文档进行章节分割,得到结构化的章节数据;提取章节数据中的车型实体,并将其与章节数据关联;对章节数据进行文本分块,为每一文本块添加车型实体,得到第一文本块;生成每个第一文本块对应的全局ID,并对每个第一文本块进行向量化处理,得到第一文本块向量;将每个第一文本块与全局ID一并保存至全文搜索数据库,将每个第一文本块向量与全局ID一并保存至向量数据库;获取用户查询信息,提取并合并用户问题与车型实体,得到合并文本;对合并文本进行向量化处理,查询全文搜索数据库和向量数据库,输出对应的第一文本块。
技术关键词
文本
汽车配件
全文搜索
大语言模型
车型
数据
滑动窗口
分块
三元组
命名实体识别模型
页面
元素
层级
应答系统
可读存储介质
存储模块
图像
格式