摘要
本说明书实施例公开了一种漂移样本获取方法及分类模型优化方法,采用上述方法,通过人工抽检的方式在线上样本集中确定人工判断标签和模型预测标签不相符的困难样本,然后针对各困难样本,若训练样本集中与困难样本相似度最高的目标训练样本和困难样本的相似度小于第一相似度阈值,则确定困难样本为第一漂移样本,进而确定线上样本集中与第一漂移样本相似度大于第二相似度阈值的线上样本为第二漂移样本,并生成包含第一漂移样本和第二漂移样本的漂移样本集,然后利用确定的漂移样本集对分类模型进行优化训练。
技术关键词
样本获取方法
分类模型优化方法
训练样本集
判断标签
计算机程序产品
处理器
模块
算法
词语
在线
文本
存储器
电子设备
分词
指令