摘要
本公开提供一种数据质检的方法、装置、电子设备及存储介质,涉及计算机技术领域。包括:获取待交付的数据集合中的第一数据,从第一数据中随机抽取第一预设数量的第二数据,获取对每一个第二数据分别对应的第二得分;从第二数据中确定对应的第二得分大于或等于预设的第一得分阈值的第三数据,在第三数据在第二数据中的第一比例小于预设的第一比例阈值的情况下,根据第二比例和预设的置信区间宽度从数据集合的当前剩余数据中确定第一目标数据,并将第一目标数据和所述第三数据作为合格数据进行交付。进行较低比例的人工质检,并通过评价模型从当前剩余数据中抽取机器质检的数据作为交付数据,避免二次或多个质检,有效提升数据质检的效率。
技术关键词
数据
大语言模型
计算机程序产品
可读存储介质
电子设备
处理器
样本
存储器
标签
模块
指令
总量
系统为您推荐了相关专利信息
知识图谱数据
知识融合方法
大语言模型
三元组
融合装置
支座反力
实时监测数据
性能预测模型
桥梁支座
桥梁主梁
态势分析方法
身份匹配方法
船舶航迹预测
人工势场
平滑方法