摘要
本发明涉及一种基于相似度算法的数据分类分级方法,利用相似度算法实现对数据资产进行分类分级的方法,引入特征项库和相似度算法模块,通过数据采集模块读取海量元数据,对海量元数据的字段名称和字段描述内容进行定制化数据清洗和标准化预处理后得到标准特征项库;再通过相似度算法模块对每个特征项与规则语料库进行相似度计算,得到特征项的分类分级结果,进而得到特征项对应数据的分类分级结果。针对不同级别的数据,用户制定不同等级的安全策略。该技术方案通过相似度计算模块对元数据集进行快速、自动分类分级的方法,从而降低人工成本,提高数据分类分级的效率和准确率。
技术关键词
数据分类分级
定制化数据
算法模块
数据采集模块
数据接入系统
文本
资产
分词
字符
符号
格式
手工
矩阵
动态
系统为您推荐了相关专利信息
癫痫患者治疗
脑电信号分析
认知功能评估
简易精神状态
数据采集模块
电池智能充电方法
智能充电管理系统
混合整数线性规划
健康监测单元
网络拓扑特征
稽核方法
人脸识别模型
人脸识别模块
特征描述符
有效性
自动监控方法
服务器
异常信息
数据获取模块
数据采集模块