摘要
本发明涉及一种智能保险代理人面访日志文本重复度检测装置及其方法,该装置包括依次连接的输入模块、预处理模块、相似度计算模块和后处理模块,该方法包括:获取待检测的当前日志和历史日志,构造文本对数据,历史日志包括历史N天内的客户拜访日志记录;针对文本对数据进行文本清洗处理,得到处理后的当前日志文本和历史日志文本;针对当前日志文本和历史日志文本,分别计算两者之间的字符相似度和语义相似度;基于字符相似度和语义相似度,结合预设的对应阈值进行比较判断,输出得到重复度检测结果。与现有技术相比,本发明将字符相似度和语义相似度相结合,能够从文字相似和语义重复方面进行高效、准确的日志重复度检测,有效提升日志质量。
技术关键词
日志
文本
度检测方法
度检测装置
语义
专业词库
字符
后处理模块
词嵌入模型
纠错单元
输入模块
转换单元
数据
编辑
产品名
客户
基座