摘要
本发明涉及数据检测技术领域,公开了一种基于目标实体多特征拟态的智能查重检测系统及方法,该方法包括:采集待检测目标实体数据,基于自然语言处理对待检测目标实体数据进行分词;提取文本特征以及语义特征;将特征融合获得拟态特征,与历史数据库进行比对,确定查重文件并确定查重相似度;将查重相似度与相似度阈值进行比对判断是否对查重相似度进行调整;当小于相似度阈值时,判定进行调整,并基于图神经网络对分词后的数据进行处理提取结构特征,将结构特征与历史数据库中的历史结构特征进行比对,根据比对结果确定调整系数对查重相似度进行调整。本申请提高了查重的准确性,全面地评估目标文本的相似性,提高了查重的精度和鲁棒性。
技术关键词
查重检测方法
语义特征
分词
实体
文本
词袋模型
自然语言
数据检测技术
汉字
节点
元素
采集单元
处理单元
鲁棒性
邻居
矩阵
精度
关系
系统为您推荐了相关专利信息
导航方法
生成图像特征
彩色图像
深度图
相机模型
情感强度预测方法
情感分析模型
多模态
数据
文本
NPC系统
文字转语音模块
前端系统
深度学习识别模型
动作表情
数据格式
低代码平台
场景构建方法
数据项
场景构建系统
智能数据检索方法
数据检索装置
意图识别
知识库管理
语义