面向大语言模型的知识库构建方法、检索方法及相关装置

AITNT
正文
推荐专利
面向大语言模型的知识库构建方法、检索方法及相关装置
申请号:CN202410905546
申请日期:2024-07-08
公开号:CN118916441A
公开日期:2024-11-08
类型:发明专利
摘要
本申请公开了一种面向大语言模型的知识库构建方法、检索方法及相关装置,该知识库构建方法中,首先,获取多个知识文档;而后,基于多个知识文档的类型所各自对应的存储规则,将多个知识文档存入向量数据库,得到知识库;其中,存储规则至少包括:若知识文档的类型为包含章节信息的第一类型,则基于章节标题将知识文档划分为多个章节块,章节块包括章节标题和章节正文;在一个章节块中,基于章节标题和按句划分章节正文得到的多个单句文本,得到拼接文本;将拼接文本存为知识、章节正文作为补充信息存为所属章节块中所有知识的元数据,逐个章节块存入向量数据库。由此,不会因按句划分知识文档而破坏其完整型,保证了存入知识库的知识的完整性。
技术关键词
知识库构建方法 大语言模型 文本 知识库检索方法 列表 存储模块 检索装置 层级 数据 样式 答案
系统为您推荐了相关专利信息
1
基于印章图像的文本识别方法、装置以及计算机设备
印章 文本识别方法 文本识别模型 矫正 图像
2
一种基于SAM的文本引导多视角火星地形特征图像分割方法
图像分割方法 地形特征 分支 多视角 文本编码器
3
基于多模态大模型识别元素生成自动化流程节点的方法
元素 多模态 节点 编码向量 编码特征
4
软件包构建问题修复方法、系统、设备、介质及产品
软件包 错误日志 大语言模型 修复方法 多轮对话
5
新媒体数据的智能处理方法及系统
媒体 主题 预估点击率 多形式 索引
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号