摘要
本发明公开了一种热门话题簇生成方法、装置、设备、介质及产品,该方法包括:获取满足采集条件的新闻数据集;对新闻数据集中的新闻数据进行话题建模聚类,得到各新闻数据所属的话题簇集;对话题簇集进行分裂及合并,确定候选话题簇;基于大模型及候选话题簇,确定最终热门话题簇。通过在话题簇合并前进行分裂处理,确保每个话题簇内新闻的高度一致性,避免了将不相关或只有微弱关联的新闻错误地归入同一话题簇,从而提高了最终热门话题簇中话题的准确性和纯净度,基于大模型确定最终热门话题簇的标题,提高了标题的质量,进而提高了最终热门话题簇的质量。
技术关键词
生成方法
话题名称
聚类
种子
排序算法
话题相关度
计算机程序产品
建立黑名单
可读存储介质
分词
数据获取模块
电子设备
处理器通信
生成装置
存储器
系统为您推荐了相关专利信息
物料识别方法
三维高斯混合模型
空间立体
特征数据库
配网杆塔
在线生成方法
时序
数据导入模块
序列
在线生成系统