摘要
本申请公开了一种结构化数据的训练数据筛选方法、装置、设备及介质,涉及数据筛选领域,包括:获取待分类分级的结构化样本各维度的元数据信息,并分别对各维度的所述元数据信息进行向量化表示,以得到各向量化表示样本;对各所述向量化表示样本分别进行加权求和,以基于相应的加权结果确定各最终向量化表示样本,对各所述最终向量化表示样本进行聚类,获取相应的聚类结果;利用所述聚类结果对所述待分类分级的结构化样本进行筛选,以得到筛选结果,并基于所述筛选结果确定所述待分类分级的结构化样本的初始训练数据。由此,本申请能够实现对初始训练数据的高质量、有效筛选。
技术关键词
数据筛选方法
样本
聚类
数据筛选装置
打标工作
校验规则
模块
可读存储介质
处理器
算法
电子设备
字典
语句
参数
存储器
计算机
系统为您推荐了相关专利信息
地表覆盖物
特征融合网络
特征提取网络
边缘检测
融合特征