摘要
本发明涉及数据处理技术领域,公开了一种智能办公知识系统及双模精准检索方法,首先关键词检索模式,将需要检索的文本进行预处理,具体使用结巴分词中文或NLTK英文加载自定义词典,并删减过滤去停用词,进行词干提取,并倒排索引构建,对关键词建立映射;语义检索模式,首先进行文本向量化,使用Word2Vec或BERT,将文档转为向量;再进行相似度计算,将文本语义转为向量V_query,并计算余弦相似度;结果加权,关键词检索得分Scorekeyword=TF‑IDF,语义检索得分Scoresemantic=cosθ,并计算融合得分;再根据融合得分进行重新排除检索出的文章顺序。本发明提高了检索效率:通过双模精准检索方法,用户能够更快地找到所需信息,减少筛选时间,提高工作效率,提升检索准确性。
技术关键词
检索方法
关键词
语义
SimHash算法
文本
计算机可存储介质
自然语言
计算机可执行指令
关系型数据库
分词
查询界面
实体
纸质文档
数据处理技术
性能监控
图谱
展示界面
模式
系统为您推荐了相关专利信息
仿真建模方法
心血管系统
左心室
路径结构
多模态心脏图像