摘要
本发明涉知识库构建领域,特别是一种知识库创建及查询方法。本发明旨在提升知识库系统处理非结构化长文本的效率。采用大语言模型的文本分片和语义向量化或专用文本向量化模型的语义向量化技术、基于经验值的固定长度分片,能够将长文本按语义或文本长度分割成小片段,并生成语义向量,从而准确捕捉查询相关的上下文信息。本发明结合向量搜索与Elasticsearch中的分词功能,自动处理同义词、多义词和复杂的上下文关联问题。此外,通过文档数据库、Elasticsearch分布式处理的支持,系统能够在大数据量下快速定位相关内容,解决传统方法在大规模数据集上查询效率低的问题。
技术关键词
分片
语义向量
大语言模型
查询方法
搜索技术
知识库系统
自然语言
文本
分词技术
创建系统
数据存储模块
查询系统
程序
多义词
同义词
输入模块
输出模块
系统为您推荐了相关专利信息
基因检测报告
交互系统
医学专业
药物经济学
药物临床试验
超声传感器
直方图
虚拟现实内容
自主系统
超声数据