摘要
本发明公开一种基于机器学习的热点问题发现方法及系统,涉及数据分析技术领域,方法包括:获取来电咨询文本,对文本进行预处理及分词;采用TF‑IDF算法计算出每个词的重要程度,选择热点词;以选出热点词的分词结果作为输入,通过Word2vec方法训练词向量模型,得到词向量,进而得到文本中每个句子的向量表示;使用k‑means聚类算法对向量化句子进行聚类,得到多个簇;将每个簇中的向量化句子合并为一个文本,使用TextRank算法分析每个簇的文本,找出该簇的热点问题;将提出问题的人与执行对应义务的人进行关联,进行热点问题的展示和明细问题下钻。本发明可以实现热点问题的自动发现和分类分析。
技术关键词
文本
训练词向量模型
分词
轮廓系数
发现系统
算法
聚类
节点
热点
数据分析技术
简体
关键词
分析模块
符号
系统为您推荐了相关专利信息
智能语音交互系统
查询关键词
文本
转换单元
智能语音交互方法
文本
语音识别单元
交互方法
数据转换模块
韵律预测
大语言模型
推荐方法
交叉注意力机制
词特征
文本
语音识别文本
多通道语音识别
语音意图识别方法
意图识别模型
声学特征