摘要
本发明公开了一种基于事件权威影响力计算的流聚类故事生成方法,属于社交媒体数据挖掘与分析技术领域。本发明首先对推文数据进行清洗、分割、分词及词性标注等预处理操作;然后对经过预处理后的推文数据进行权威影响力计算;最终基于推文事件权威影响力筛选排序进行流聚类生成不同故事类簇。本发明针对海量推文数据的涌现难以聚焦事件关键信息的问题,通过对推文数据构建权威影响力计算排序优化Single‑Pass算法,实现更为简明清晰的故事生成,为下游的热点事件分析等应用提供有力的支撑。
技术关键词
故事生成方法
社交媒体数据挖掘
话题模型
文本
算法
深度学习模型
网络平台
校准
文章
自然语言
语句
网络结构
度量
三元组
实体
社会
分词
系统为您推荐了相关专利信息
NPC系统
文字转语音模块
前端系统
深度学习识别模型
动作表情
报警识别方法
噪声干扰信号
供水管
记录仪
过采样技术