摘要
本发明公开了基于语义相似度的论文数据处理方法及系统,其中,论文数据处理方法,适用于论文作者重名消歧,所述论文数据处理方法包括:获取目标作者的比对信息,所述比对信息包括:目标作者的名称信息;获取所述名称信息的论文集合,提取论文集合中每篇论文的作者集以及单位集;比较任意两篇论文的单位集是否一致,若两篇论文的单位集一致,则比较论文相似度:若论文相似度小于第一阈值,则比较作者集的重合率:若作者集的重合率小于第三阈值,则提取论文中关键词,并进行关键词语义相似度比对分析;若关键词语义相似度小于第二阈值,则为两篇论文的名称信息打上不同的标签。本发明能够实现对论文作者重名消歧。
技术关键词
论文
数据处理方法
关键词
语义
标签
数据处理系统
核心
模块
层级
算法
系统为您推荐了相关专利信息
风险预测方法
数据
多模态特征融合
异构
生态遥感
风险预测模型
指标
数据随时间
神经网络模型
画像
图像处理网络
事件特征
注意力机制
动态场景
抑制背景噪声
语义特征
文本
融合特征
交叉注意力机制
图像修复方法