摘要
本发明涉及文本处理技术领域,具体涉及一种基于话题热度指数的事件脉络生成方法及系统;本发明方法包括基于社交媒体平台中某一关键词下每条文本的在话题下的话题热度指数,对文本进行筛选,再通过语义相似度对筛选后的文本的话题标签进行筛选,然后将每条文本的话题标签向量和文本正文向量进行拼接累加再平均,得到每条文本话题标签的特征表示,计算话题标签间的特征表示的相似度和时间相似度,将文本的话题标签进行合并,得到话题标签节点;基于时间轴的改进层次聚类算法,将话题标签节点纳入相应的分支;本发明综合计算话题标签之间的相似度,有效地合并相似或重复的话题标签,采用基于时间轴的层次聚类算法,实现清晰有序的事件脉络的生成。
技术关键词
话题
事件脉络生成方法
标签
社交媒体平台
层次聚类算法
指数
节点
生成系统
语义
时间序列特征
关键词
文本处理技术
模块
分支
系统为您推荐了相关专利信息
角膜塑形镜
训练样本集
计算机辅助诊断技术
机器学习算法
年龄
分布式网关
网络安全检测方法
异常事件
链路
网络安全检测系统
工作控制方法
UWB基站
障碍物
数字孪生模型
距离信息
性能测试方法
数据格式
协议解析器
特征匹配算法
性能测试装置