摘要
本申请涉及数据标识技术领域,尤其涉及一种涵盖物理、语义、敏点的数据安全标识方法,包括:通过对获取的第一行业综述性文档集合和第二行业综述性文档集合进行处理,生成行业语义特征词库;对各敏点信息句进行语义分析,生成敏点信息词组序列,以敏点信息词组序列为输入,通过专业领域文档进行训练,生成词向量模型,通过对词向量模型进行相似计算,生成敏感特征词库;基于行业语义特征词库和分词工具,对目标文档进行关键词分词,生成语义安全标识;基于停用词库,行业语义特征词库对目标文档中的目标句进行分词,结合敏感特征词库,生成敏感安全标识。应用本方法在数据调整的情况下仍可有效识别,强化了身语义表示。
技术关键词
特征词库
语义特征
词向量模型
标识方法
数据安全
分词词库
关键词
序列
标识技术
词频统计
专业
标识装置
物理
模块
系统为您推荐了相关专利信息
信息检索
零知识证明协议
同态加密方法
隐私查询方法
服务器
独居老人生理状态
监测预警方法
监测系统
数据
智能手机
深度特征融合
图像分割模型
图像分割方法
线索
融合特征