摘要
本发明涉及一种基于K‑近邻算法的数据资产智能分类的方法,包括如下步骤:1)抽取来自于源系统元数据信息,包括表元数据信息以及列元数据信息;2)元数据注释补充与完善精细化处理;3)样本数据资产分类标签识别;4)特征数据元构建与标准化;5)模型数据划分;6)模型训练;7)基于最优K近邻算法模型进行数据资产类型的自动划分;本发明基于表、列元数据进行深度处理后,基于K近邻算法的数据资产分类模型,对数据资产进行智能分类,大大提高了数据资产分类的效率,为后续的数据资产分类分级管理提供强有力的支撑。
技术关键词
资产
K近邻算法
分类分级管理
KNN算法
标签
训练集数据
质量保证
分类器
样本
邻居
核心
编码
矩阵
指标
基础