摘要
本发明提供一种基于机器学习的样本数据处理方法和装置,所述方法包括:获取待处理的原始数据,并构建第一数据库,将所述第一数据库中的数据输入预先训练的数据处理模型,以得到所述数据处理模型输出的目标样本类别和各目标样本类别对应的数据;对各目标样本类别的数据数量进行统计;其中,所述数据处理模型是基于预先构建的深度学习网络,利用第二数据库中的图像样本和对应的类别标签进行训练得到的,所述第二数据库是利用预先构建的样本选择模型从原始数据样本中筛选出的图像样本构建的。解决了现有技术中存在的数据集中存在较多的无效标注的问题,提高了模型训练效率。
技术关键词
数据处理模型
样本数据处理方法
深度学习网络
样本数据处理装置
图像
非暂态计算机可读存储介质
标签
概率密度函数
数据采集单元
处理器
计算机程序产品
表达式
参数
存储器
训练集
电子设备
系统为您推荐了相关专利信息
北斗导航定位
信息发布系统
车辆定位
卡尔曼滤波算法
误差
公共安全应急指挥
决策支持方法
决策支持系统
空天地一体化
动态博弈论
图像处理方法
图像处理装置
缺陷检测设备
模型更新
数据
序列
多尺度卷积神经网络
手写汉字图像
语义特征
依赖特征