摘要
本发明涉及数据处理技术领域,具体涉及一种面向智慧办公系统的文档脱敏存储方法,包括:获取文档的标题、内容及关键词、句子数和字数、任意两个文档的标题和内容重复率及含关键词的句子数;计算任意两文档的标题相似度和内容相似度;根据标题和内容相似度得到整体相似度;根据整体相似度找到相似类文档;根据相似类文档数量、重复率和字数计算差异性系数;根据差异性系数、含关键词句子数和关键词数量计算独特性;根据独特性进行脱敏保密处理。本发明能准确识别出文档的独特性,从而有针对性地进行信息脱敏和保密处理。
技术关键词
文档内容信息
智慧办公系统
关键词
存储方法
DTW算法
指数
数据处理技术
编码方法
系统为您推荐了相关专利信息
电池数据处理方法
输出特征
模型库
数据处理功能
关键词
对象
信息推荐方法
数据
信息推荐装置
协同过滤算法
图像采集检测方法
图像采集定位装置
儿童
关键词
年龄