一种语言模型对话式的知识库内容搜索方法、设备及介质

正文

推荐专利

申请号：CN202510871796

申请日期：2025-06-26

公开号：CN120892519A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种语言模型对话式的知识库内容搜索方法、设备及介质，属于人工智能技术领域，用于解决现有的知识库内容搜索时，容易造成语义理解偏差、维度考量失衡、文档解析混乱以及大规模数据处理效率低下的技术问题。方法包括：将用户向知识库上传的不同类型文档进行文档解析处理，得到文档内容数据；对文档内容数据进行文本块的分片与合并处理，得到分块文档内容数据；将分块文档内容数据进行向量化的入库处理；并将入库的分块文档内容数据进行重组标记处理；根据用户的检索请求数据，对知识库进行相似文档块的搜索处理，得到搜索结果数据；对搜索结果数据中对应的文档块进行答案数据的提取处理，生成与检索请求数据对应的回答数据。

技术关键词

内容搜索方法分块文本 XGBoost模型大语言模型文件类型识别格式非易失性计算机可读存储介质非易失性计算机存储介质关系型数据库内容搜索设备分布式搜索引擎布局结构标记分片答案文件头信息连续性上下文特征

系统为您推荐了相关专利信息

一种开放文本的地理场景三元组提取方法

三元组语义文本实体场景

基于知识图的跨语言文档检索方法、系统、介质及设备

文档检索方法文档关键词样本维基百科文档检索系统

一种基于大语言模型的电子测试仪器知识库构建方法

电子测试仪器知识库构建方法大语言模型信息抽取方法关系型数据库

基于实时反馈的面试官评估偏见校正方法及系统

校正方法偏差文本语义意图

任务处理方法和装置

序列大语言模型计算机程序产品可读存储介质计算机设备

一种语言模型对话式的知识库内容搜索方法、设备及介质

站点导航

APP 下载