摘要
本申请提供了一种基于文档切分的检索方法、装置和文档检索系统。该方法包括:获取待切分文档;基于NLP算法计算待切分文档的各部分文本之间的语义的相似度,得到第一语义相关度;根据各部分文本的第一语义相关度,对待切分文档进行切分,得到多个语义文本块,其中,语义文本块包括至少一个部分文本;在接收到查询请求的情况下,基于NLP算法计算查询请求对应的查询文本与各语义文本块之间的语义的相似度,得到多个第二语义相关度,将与查询请求对应的查询文本的第二语义相关度最高的语义文本块确定为目标语义文本块,并将目标语义文本块展示在显示界面中。该方案解决了现有技术中文本检索的时候的准确率较低的问题。
技术关键词
语义相关度
文本
文档检索系统
词语
检索方法
字符
密度
算法
检索装置
字段
计算机程序产品
处理器
界面
存储器
标签
系统为您推荐了相关专利信息
智能评估方法
语义特征
皮尔逊相关系数
特征提取模型
计算机可执行指令
视频自动生成方法
大语言模型
自动生成系统
生成小说
多模态
房屋框架结构
场景生成方法
自然语言
房间
词嵌入向量