基于多粒度检索的大模型知识库构建方法

AITNT
正文
推荐专利
基于多粒度检索的大模型知识库构建方法
申请号:CN202510188815
申请日期:2025-02-20
公开号:CN119647581A
公开日期:2025-03-18
类型:发明专利
摘要
本发明公开了基于多粒度检索的大模型知识库构建方法,包括:获取目标文本并解析文档结构,按照标题、片段和句三个级别拆分并重新组织文本数据,构建标题、片段和句三个级别知识;利用大语言模型根据句级别知识构建生成式索引作为问题级别知识;利用向量模型生成表征片段级别知识和/或句级别知识的索引键的第一向量,以及表征标题级别知识和/或问题级别知识的索引键的第二向量;分别存储第一向量和第二向量至向量数据库中,并将第一向量和第二向量对应的索引值和索引类型存储至关系型数据库中。本发明实现多粒度的文档知识库构建,扩充知识在不同粒度下的表达方式,提高用户查询与知识匹配的精确性,解决了现有方法中信息丢失或不完整的问题。
技术关键词
知识库构建方法 索引 便携式文档格式 大语言模型 文本 关系型数据库 知识点 组织
系统为您推荐了相关专利信息
1
一种基于气动声学与深度学习的风力机叶片故障检测方法
风力机叶片 故障检测方法 功率谱密度特征值 数据 索引
2
一种施工方案对比纠错系统及其方法
纠错系统 智能信息识别 命名实体识别 模块 填充算法
3
基于云计算的大数据处理方法及云计算平台
数据处理方法 关系 知识图谱构建 平台 矩阵
4
一种城市内涝监测方法、装置、电子设备及存储介质
内涝监测系统 城市内涝监测方法 预警智能 融合特征 视频数据特征
5
基于人工智能的工程管理BIM系统评估方法及其系统
系统评估方法 文本 蒙特卡洛树搜索 数据变化趋势 拒绝服务攻击
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号