摘要
本发明涉及文献分析领域,提供一种用于科学文献趋势稳定识别的时序语义对齐方法,包括:获取现有文献的时间戳标记并确定文献来源,进行时间差分更新,得到同步文献数据和同步时间戳;将同步文献数据输入大语言模型,得到关键词列表,进行数据清洗得到目标关键词列表;将目标关键词列表输入语义嵌入模型中得到关键词向量;通过综合层次聚类算法对关键词向量进行初步聚类,得到聚类表格;对聚类表格进行再嵌入,接着使用平均距离法进行层次聚类,并通过改变距离阈值得到关键词锚点,通过关键词锚点和同步时间戳得到文献趋势分析结果,从而完成对文献趋势的分析与展示。本发明可以对科学文献趋势进行分析。
技术关键词
关键词
对齐方法
层次聚类算法
语义
大语言模型
列表
时序
表格
非暂态计算机可读存储介质
计算机程序产品
锚点
标记
数据
主题
对齐系统
缓存策略
语句
轮廓系数
时间差
系统为您推荐了相关专利信息
全景影像数据
投影变换矩阵
支持多源数据融合
全景图
RANSAC算法
视频帧
空间特征提取
语义分析模型
采样率
非暂时性机器可读存储介质
知识图谱推理方法
大语言模型
关系
文本
生成上下文感知