摘要
本发明公开了一种基于知识图谱的文献计量方法及装置,所述方法包括:统计文献数据集中每一主题词出现的词频,确定逆文本频率指数,得到每一主题词的逆文本频率权重值;对所述每一主题词的逆文本频率权重值进行降序排序,得到降序后的逆文本频率权重值;根据预设筛选条件和所述降序后的逆文本频率权重值,得到文本特征值;采用聚类算法和余弦距离函数,对主题词进行聚类,得到文本核心主题。本发明的基于知识图谱的文献计量方法通过高频词共词分析构建词频矩阵,挖掘关键词之间的互相关联,利用文本聚类对主题词之间的距离进行计算,明确研究主题,有效地确定了文本核心主体与相关领域研究热点。
技术关键词
文本特征值
计量方法
频率
聚类算法
主题
核心
数据
种子数
图谱
指数
对象
可读存储介质
存储计算机程序
处理器
指令
模块
关键词
系统为您推荐了相关专利信息
电离层建模方法
消除接收机
精密单点定位
表达式
加权最小二乘
同步方法
数字孪生系统
数据采集架构
智能产线
实体