摘要
本发明涉及数据压缩技术领域,具体为基于重山压缩的大数据标签方法,包括:获取目标大数据标签集合,对所述目标大数据标签集合进行预处理操作,所述预处理操作用于去除所述目标大数据标签集合中无效的目标大数据标签;利用重山压缩算法识别所述目标大数据标签集合中的重复模式,并对所述目标大数据标签集合进行压缩,以得到压缩数据包;将所述压缩数据包存储至数据库中;当需要使用所述目标大数据标签时,利用重山解压缩算法对所述压缩数据包进行还原,以得到原始目标大数据标签。本发明首先对目标大数据标签集合进行预处理,去除无效的标签,可以减少后续处理的数据量和提高数据质量。
技术关键词
大数据
数据标签方法
解压缩算法
数据压缩技术
模式
关系型数据库
指纹
字符
编码
聚类算法
解码
特征值
时间段
文本
分段
系统为您推荐了相关专利信息
交通信号灯信息
智能驾驶车辆
交通信息管理
计算机执行指令
决策
识别规则库
结算方法
支付主体
机器学习算法
报销管理系统