摘要
本发明提供一种网络文本数据的热点获取方法和热点热度分析方法,包括依据热点规则过滤网络数据,提取与热点相关的若干数据元;数据元分词处理以获取特征词,依据特征词生成数据元向量;基于聚类策略确定数据元向量的内若干聚类中心,合并相似聚类中心以确定类中心,以类中心表示热点,所述所述数据元包括文本特征和非文本特征。本发明通过将数据元内多角度数据融合至一个数据元向量内,提高热点发现的准确性。
技术关键词
热点获取方法
热度分析方法
文本
数据
网络
初始聚类中心
语种识别
翻译模型
关键词
分词
策略
自然语言
因子
帖子
多角度
主题
语义
阻尼
系统为您推荐了相关专利信息
软件测试需求
自动化测试方法
训练集
列表
自动化测试装置
节目特征
偏好特征
生成电子节目指南
兴趣
文本分析模型
尺寸缺陷
表面图像数据
算法模型
缺陷识别定位
端面缺陷
电缆绝缘老化状态
指数
拉曼光谱分析仪
报警设备
拉曼光谱数据
气象监测数据
多元线性回归模型
数值
气象预报数据
平台