摘要
本发明公开了基于多粒度检索的大模型知识库构建方法,包括:获取目标文本并解析文档结构,按照标题、片段和句三个级别拆分并重新组织文本数据,构建标题、片段和句三个级别知识;利用大语言模型根据句级别知识构建生成式索引作为问题级别知识;利用向量模型生成表征片段级别知识和/或句级别知识的索引键的第一向量,以及表征标题级别知识和/或问题级别知识的索引键的第二向量;分别存储第一向量和第二向量至向量数据库中,并将第一向量和第二向量对应的索引值和索引类型存储至关系型数据库中。本发明实现多粒度的文档知识库构建,扩充知识在不同粒度下的表达方式,提高用户查询与知识匹配的精确性,解决了现有方法中信息丢失或不完整的问题。
技术关键词
知识库构建方法
索引
便携式文档格式
大语言模型
文本
关系型数据库
知识点
组织
系统为您推荐了相关专利信息
风力机叶片
故障检测方法
功率谱密度特征值
数据
索引
纠错系统
智能信息识别
命名实体识别
模块
填充算法
内涝监测系统
城市内涝监测方法
预警智能
融合特征
视频数据特征
系统评估方法
文本
蒙特卡洛树搜索
数据变化趋势
拒绝服务攻击