摘要
本发明涉及自然语言处理和数据挖掘领域,尤其涉及一种事件发展脉络挖掘分析方法及存储介质,包括如下步骤:聚类中心点计算;基于新闻聚类结果计算新的聚类中心点作为事件的发展脉络节点;事件脉络构建;聚类完成后,选择聚类中心作为代表当前热点事件的关键新闻,然后跟踪事件的演变,重复前序步骤,计算其它新闻与当前聚类中心的相似度,如果相似度超过设定的阈值,则将该新闻归为该事件,如果聚类中新增的新闻数量达到一定阈值,则重新计算聚类中心,更新事件脉络节点,本发明构建了一个动态的事件脉络推演模型,能够清晰展示热点事件的发展过程及其关键节点,这种基于时间序列的分析方法使得事件脉络更加连贯和准确。
技术关键词
挖掘分析方法
聚类
文本特征向量
DBSCAN算法
邻域
启发式规则
核心
词语
可读存储介质
分词算法
热点
计算机
噪声数据
节点
密度
自然语言
定义
代表
系统为您推荐了相关专利信息
模型优化方法
点云模型
特征点云
点选取方法
邻域
对位方法
芯片基板
拓扑图
视觉传感器
双层筛选机制