摘要
本申请涉及一种基于机器学习的自动数据安全分级方法,包括:从预设知识库中获取数据元标签和场景标签的文本描述,生成组合文本并通过文本嵌入模型映射为语义向量,构建初始语义向量集合;根据初始语义向量集合结合标注数据,采用回归模型训练生成初步安全评分集合;针对初步安全评分集合计算评分值与整数值的差值,标记模糊条目并构建模糊条目集合;对模糊条目集合进行优先级排序,提取特征数据进行比对分析,生成特征匹配报告;根据所述特征匹配报告调整评分值,构建中间安全评分集合;对中间安全评分集合进行二次比对,保留模糊标记状态,构建最终需复核条目集合;根据最终需复核条目集合生成结构化预测数据报告并存储。
技术关键词
语义向量
数据安全
条目
梯度提升机
模糊阈值
报告
支持向量机算法
SVM分类器
标签
算法校验
线性插值法
中文文本
误差控制
生成特征
标记
场景
滑动窗口
偏差
系统为您推荐了相关专利信息
数据安全防护方法
加密策略
量子加密算法
四维超混沌系统
量子随机数发生器
数据压缩方法
分层存储结构
误差预算
误差控制
条目
图像检索方法
深度神经网络
语义特征提取
HSV颜色直方图
图像检索装置