摘要
本申请涉及数据安全技术领域,具体涉及一种防止信息泄露的矢量签章方法、装置及系统,该方法包括:获取所有待签章文本数据;根据所有待签章文本数据中词汇的敏感性特征和词频特征获取各词汇的词频特征值;根据各词汇与其所在待签章文本数据中的其他词汇之间对应词向量的距离以及词频特征值的差异,分别获取各词汇的语义特征距离和词频特征距离,进而将各词汇映射到二维坐标系中;对二维坐标系中的词汇进行聚类;根据各聚类簇中所有词汇的语义特征距离和词频特征距离,从所有待签章文本数据中选取出部分词汇进行分块,进而生成矢量签章。本申请通过深入分析文本数据中的语义特征和词频特征,选取出容易被篡改的词汇,提升了矢量签章的安全性。
技术关键词
签章方法
词频统计
特征值
文本
语义特征
坐标系
签章装置
分块
敏感性特征
聚类算法
数据安全技术
生成哈希值
签章系统
加密
数据采集模块
处理器
分析模块