文档查重方法及计算设备

AITNT
正文
推荐专利
文档查重方法及计算设备
申请号:CN202510398555
申请日期:2025-03-31
公开号:CN120542406A
公开日期:2025-08-26
类型:发明专利
摘要
本申请实施例提供了一种文档查重方法及计算设备。方法包括:根据待查重的第一文档,确定目标文本;目标文本用于表征所述第一文档中的关键信息;从多个预设文档中,确定与目标文本的满足相似度条件的第二文档;基于第一文档对应的第一知识图谱和第二文档对应的第二知识图谱进行知识图谱匹配,得到第一文档与第二文档之间的第一相似特征;确定第一文档与第二文档之间语义相似的特征,作为第一文档与第二文档之间的第二相似特征;基于第一相似特征和第二相似特征,确定针对第一文档的查重结果。将表层特征比对和深层特征查重相结合,实现高效、准确的文档查重,降低误报率。
技术关键词
图谱 文本 文档查重方法 计算机程序指令 目录 三元组 节点 主题 语义 实体 存储器 处理器 资金 地点 阶段 关系
系统为您推荐了相关专利信息
1
商品属性的抽取方法、装置、设备、存储介质和程序产品
属性抽取模型 多模态 文本 混合损失函数 图像
2
网络数据异常识别方法与计算机设备
网页敏感信息 异常识别方法 生成网页 样本 网络
3
基于结构连接和证据积累聚类的丘脑核分割方法与装置
分割方法 纤维束 追踪方法 影像 分辨率
4
一种基于历史知识的场景重建方法及系统
场景重建方法 节点 资料 场景重建系统 虚拟建模技术
5
一种燃气管网突发事件情景要素关联关系建立方法
关联关系建立方法 情景 燃气管 词语 突发事件数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号