摘要
本发明涉及自然语言数据处理技术,具体涉及一种大量重复工单快速识别方法。识别方法包括以下过程:舆情数据预处理;根据舆情池数据量阈值更新舆情池数据;词嵌入操作,将文本转换为向量;舆情池更新;舆情语义去重;本发明针对舆情工单应急处置构建适合舆情监控领域的工单拦截和持续派单耦合方法,可以解决目前舆情监控普遍面临的舆情发酵时特定舆情事件干扰正常舆情工单生成和工单研判问题。该方法在数据预处理、词嵌入的基础上增加了向量数据库、舆情池、时间窗等模块,实现热点事件持续间断性派发工单的,非热点事件少排工单的效果。
技术关键词
快速识别方法
文本
自然语言数据处理
Word2Vec模型
word2vec模型
舆情监控
分词
删除过期数据
耦合方法
语义
先进先出
动态更新
数据更新
标签
算法
热点
度量
模式
系统为您推荐了相关专利信息
图像块
图像生成模型
文本
计算机可读取存储介质
样本
性能检测系统
集成控制模块
脚本
数据分析模块
半导体检测技术