摘要
本发明公开了一种基于信息冗余度的调用链数据压缩方法及系统,方法包括:针对收集的调用链数据,采用KMeans算法提取相似数据,将所述调用链数据中的数据点分组,得到各个聚类组;其中,同一聚类组内的数据相似度高,不同聚类组间的数据相似度低;采用基于层次聚类的离线尾部抽样策略所述聚类组进行抽样处理,输出结构化文件;采用无损压缩的方式对所述结构化文件进行无损压缩处理,完成对所述调用链数据的压缩。本发明针对调用链数据的特性,结合了有损压缩的采样思想,在保持数据分析价值的基础上大幅减少了压缩后文件的大小和存储负担,提高了效率和实时性,能够保证数据完整性并强化泛化能力,可广泛应用于计算机技术领域。
技术关键词
数据压缩方法
冗余度
轮廓系数
树状结构
Kmeans算法
标准化工具
层次聚类算法
节点
离线
数据存储单元
数据处理单元
代表
服务组件
策略
压缩算法
系统为您推荐了相关专利信息
综合检测方法
载荷传递路径
仿真软件
车辆部件
更换缓冲装置
故障检测方法
故障诊断专家系统
运载火箭
节点
终点
监督学习模型
特征识别方法
双向长短期记忆
识别电力用户
轮廓系数
智能决策系统
分析模块
数据处理模块
数据采集模块
特征提取单元