摘要
本申请实施例提供了一种文档查重方法及计算设备。方法包括:根据待查重的第一文档,确定目标文本;目标文本用于表征所述第一文档中的关键信息;从多个预设文档中,确定与目标文本的满足相似度条件的第二文档;基于第一文档对应的第一知识图谱和第二文档对应的第二知识图谱进行知识图谱匹配,得到第一文档与第二文档之间的第一相似特征;确定第一文档与第二文档之间语义相似的特征,作为第一文档与第二文档之间的第二相似特征;基于第一相似特征和第二相似特征,确定针对第一文档的查重结果。将表层特征比对和深层特征查重相结合,实现高效、准确的文档查重,降低误报率。
技术关键词
图谱
文本
文档查重方法
计算机程序指令
目录
三元组
节点
主题
语义
实体
存储器
处理器
资金
地点
阶段
关系
系统为您推荐了相关专利信息
场景重建方法
节点
资料
场景重建系统
虚拟建模技术
关联关系建立方法
情景
燃气管
词语
突发事件数据