摘要
本申请涉及一种重复数据删除方法、产品、计算机设备和存储介质。本申请通过将写入数据对象切片为多个预存数据块实现在分布式存储系统中存储,而且将预存数据块映射定位方式实现在线存储到守护进程中,基于在线重删方式将所述守护进程中的预存数据块的块指纹与存储节点中已存储的数据块的块指纹对比识别是否为重复数据,对应重复数据的块指纹对应的引用计数加一可避免写入重复数据,而且对应删除所述守护进程中为重复数据的预存数据块及块指纹可避免在海量小文件场景中随机广播方式导致性能下降的问题,同时在线重删方式能实现在分布式存储系统数据均衡中避免查找过程复杂导致性能下降的问题。
技术关键词
分布式存储系统
重复数据删除方法
指纹
标签
对象
节点
进程
小数据
计算机设备
客户端
海量小文件
垃圾
一致性算法
链表
切片
处理器
标志
计算机程序产品