摘要
本发明提供了一种工单聚类与主题提炼方法、系统、设备及介质,属于自然语言处理与数据挖掘技术领域。所述方法包括:获取原始工单数据,进行数据清洗后,根据预设的摘要约束使用文本摘要生成技术在原始工单数据提取出工单摘要,并生成摘要集合;将工单摘要输入语言模型中,生成预设维度的语义向量,并通过FAISS库构建向量索引,把摘要集合转换为数值向量的集合;运用改进K‑means算法,对数值向量进行聚类,输出K组数量均衡的工单摘要;针对每组工单摘要,基于文本相似度筛查出代表性摘要;采用关键词提取技术从代表性摘要中提取出关键词,生成每组工单摘要的关键词列表;针对每组工单摘要的关键词列表,通过合并关键词生成主题标签。
技术关键词
语义向量
生成主题
训练语言模型
数值
列表
生成关键词
文本
标签
算法
关键词提取技术
摘要提取模块
BERT模型
初始聚类中心
数据挖掘技术
系统为您推荐了相关专利信息
训练样本数据
反演方法
地下水
参数
神经网络模型
性能检测系统
集成控制模块
脚本
数据分析模块
半导体检测技术
网络配置参数
网络节点
异质
网络拓扑
配置检测方法
文本
数据
预测系统
互联网购物平台
物联网通信网络