摘要
本发明公开了一种基于双层结构熵图聚类的社交事件脉络生成方法,采用双层的、基于结构熵的聚类方法,通过粗粒度聚类进行主题聚类,细粒度的事件聚类来形成事件节点,并使用大模型来生成事件节点的摘要;并且构图不仅考虑关键词共现频率,还通过SentenceBert计算相似度考虑到语义,并且考虑消息之间的时间跨度对边删减,能构造一个好的社交消息图,进而提升图聚类效果,更好的进行社交事件时间线脉络分析。
技术关键词
事件脉络生成方法
关键词
双层结构
社交
社区检测算法
生成事件
事件检测算法
节点
聚类
摘要
主题
分词算法
词袋模型
媒体
频率
短消息
代表
语义