摘要
本发明属于数据追踪技术领域,本发明提供了基于对象存储数据抓取路径追踪系统及方法,包括:根据主题关键词比对,筛选出数据文本候选集,根据数据文本的归属领域及文本数量,处理得到检索范围值,判断是否需要缩减索引范围,若是,结合布尔运算符缩减索引范围,有利于提高索引匹配效率;利用自然语言处理技术得到数据文本的语义向量与数据检索文本的语义向量,并处理得到相似度;结合对应的新的数据文本候选集中数据文本的特征数据,并进行关联性分析,得到关联值,并结合数据文本与数据检索文本之间的相似度,处理得到匹配度,根据匹配度向用户推荐相应的数据文本,提高存储数据的抓取准确率。
技术关键词
文本
主题关键词
路径追踪方法
检索平台
路径追踪系统
语义向量
情景
词语
自然语言
对象
数据追踪技术
索引
高维向量空间
统计特征
标记
频率
数据比
跨度