摘要
本申请涉及自然语言处理技术领域,尤其涉及一种网络舆情热点话题识别方法、装置及设备,其中,网络舆情热点话题识别方法包括:通过中文预训练语言模型对社交媒体文本数据进行嵌入,得到对应的高维向量表示;采用基于流形学习的降维算法对所述高维向量表示进行降维,得到降维后的文本数据;对所述降维后的文本数据进行密度聚类,并从聚类结果中提取关键词作为识别到的话题。本申请能够从海量社交媒体数据中准确识别和总结出具有高度关注度和代表性的舆情话题,提升了舆情热点识别的自动化水平,也为舆情分析与决策提供了更加精确和及时的信息支持。
技术关键词
预训练语言模型
识别方法
文本
社交
媒体
网络
热点话题识别
大语言模型
关键词
聚类
密度
可读存储介质
摘要
词袋模型
加权算法
数据嵌入
处理器
系统为您推荐了相关专利信息
超分辨率遥感影像
超分辨率方法
大语言模型
文本编码器
样本
web服务系统
数据分析服务
运维
大语言模型
多源运行数据