摘要
本申请公开了一种邮件错分风险的判定方法、设备及介质,其中方法包括:基于地址数据集构建对比学习数据集;确定地址数据集中发生过错分的负例邮件地址,以及未发生过错分的正例邮件地址,通过过采样处理,均衡负例邮件地址以及正例邮件地址的数量级,得到错分风险数据集;对预训练语言模型编码器进行对比学习优化;训练分类器模型;将待判定邮件地址输入至经过对比学习优化的预训练语言模型编码器中,以得到待判定邮件地址对应的语义信息;将语义信息输入分类器模型中,以得到待判定邮件的错分风险概率。能够识别并评估邮件收件地址文本中潜在的错误分拣风险,减少配送延误,降低重新分拣、二次配送等不必要成本。
技术关键词
条目
训练分类器模型
样本
预训练语言模型
数据
编码器
风险
邮件
非易失性计算机存储介质
判定方法
计算机可执行指令
语义
中文标点符号
物理
标签
线性变换矩阵
BERT模型
处理器