摘要
本发明公开一种基于自然语言处理和知识图谱的文件智能搜索方法及系统,涉及信息检索技术领域,方法包括:对获取的文件数据进行预处理,包括文件格式转换、噪声过滤和文本提取;利用自然语言处理技术对提取的文本内容进行语义分析,为构建知识图谱和后续的搜索处理提供语义层面的支持;基于语义分析的结果,构建文件领域的知识图谱;用户输入查询语句时,对查询语句进行语义理解、查询扩展和查询转换的处理,将查询语句转换为知识图谱可理解的查询表达式;根据查询表达式,在知识图谱中进行搜索,依据相关性计算排序结果并可视化呈现。本发明可以提高文件搜索的准确性、相关性和智能性。
技术关键词
语义依存分析
实体
智能搜索方法
自然语言
智能搜索系统
构建知识图谱
分词
关系
表达式
语句
关键词
意图分类模型
三元组
文本
预训练语言模型
语义层面
广度优先搜索
深度优先搜索
系统为您推荐了相关专利信息
命名实体识别
定位方法
视觉特征提取
图像特征向量
场景
合金
命名实体识别
信息获取方法
机器学习模型
文本挖掘方法
巷道模型
三维实体模型
信息化建设技术
空间结构
预警模块