摘要
本发明一种工单查重方法、系统、设备及存储介质。工单查重方法包括:获取查询工单数据和历史工单数据并进行预处理,获得查询工单词表和历史工单词表;通过预先训练好的Word2vector模型分别对查询工单词表和历史工单词表进行词向量转化并求和,获得查询工单向量和历史工单向量并计算第一相似度;基于查询工单词表和历史工单词表通过Jaccard计算第二相似度;通过BERT‑based提取查询工单数据和历史工单数据的感情特征向量并计算第三相似度;基于第一相似度、第二相似度和第三相似度,确定查询工单数据是否重复。本发明通过从语义、词共现次数和感情三个方面对查询工单数据和历史工单数据计算相似度,并通过相似度对工单进行查重,提高了对工单查重的准确度。
技术关键词
历史工单数据
计算机可执行指令
停用词表
处理器
可读存储介质
标签
序列
电子设备
分词
模块
存储器
语义
系统为您推荐了相关专利信息
激光测距方法
回波
激光测距电路
环境光噪声
模数转换器
风险评价方法
风光互补
出力场景
计算机可执行指令
计划
列车运行信息
加速度
LSTM模型
列车自动防护系统
预警方法