摘要
本发明公开了一种基于论文标题和摘要的语义相似可视化方法和系统,首先构建自有集成文献数据库并生成每一论文与论文标题和摘要匹配的文本嵌入向量和图像嵌入向量;随后使用t‑SNE非线性降维算法定义每一论文的嵌入向量在高维空间的概率分布并映射到低维空间保持每一论文间的相对距离;再对降维后每一论文的嵌入向量进行聚类,提取每个聚类簇中出现频率最高的论文关键词作为主题标签;然后根据语义相似度对每一论文分配主题标签,并使用PageRank计算论文被引次数;最后基于聚类结果和被引次数对论文进行可视化展示。本发明挖掘论文间的内在联系并利用可视化技术以直观的方式呈现,提高了学术研究的效率。
技术关键词
论文
可视化方法
图像嵌入
非线性降维算法
摘要
语义
主题
关键词
文本
聚类
标签
交互式可视化
损失函数优化
分词
自然语言
样本
模块
可视化系统
字符
可视化技术
系统为您推荐了相关专利信息
区块链数据库
智能管理方法
椭圆曲线数字签名算法
动态权重分配
时序特征
操作界面
组件可视化方法
神经网络模型
指令
编辑
国密算法
安防监控系统
加密解密模块
加密装置
识别视频流
多模态
三维模型
可视化方法
数据
计算机可读指令