摘要
本发明公开了一种学科交叉领域前沿的识别方法、系统及程序产品,解决前沿识别过程中时间滞后、非正常引用干扰及核心论文缺失的问题。所述识别方法包括数据收集、采用文本相似度检测算法提取论文家族、根据论文节点度及跨学科指标Variety提取所述论文家族中的基本论文和备选前沿主题以及采用主题聚类或者共被引聚类算法或专家研判对备选前沿主题再次聚类,获取前沿名称等步骤。本发明采用基于论文家族和基础论文的学科交叉领域前沿识别能更好地将前沿识别与学科发展脉络联系起来,且通过聚类筛选强化学科交叉属性,通过结合论文家族规模限制和前沿主题再次聚类平衡识别准确度和算法开销的目的。
技术关键词
论文
识别方法
主题
聚类
家族
计算机程序产品
算法
识别系统
数据收集模块
节点
文本
核心
指标
信息熵
网络
规模
关键词
系统为您推荐了相关专利信息
蛋白质分类方法
拓扑特征
神经网络结构
样本
词袋模型
文本识别模型
融合特征
图像
文本识别方法
注意力