摘要
本申请公开了数据处理方法、设备、存储介质及程序产品,包括:去除第一文档对象中的噪声节点,得到第二文档对象;根据所述第二文档对象中节点的属性信息,去除所述第二文档对象中的无关节点,得到第三文档对象;通过多个哈希算法计算得到所述第三文档对象的哈希值;根据所述第三文档对象的哈希值和所述文档对象的语义特征,确定所述第三文档对象的指纹信息。通过去除文档对象中的噪声节点和无关节点后,通过多个不同的哈希函数计算得到文档对象的哈希值,然后进一步根据文档对象的哈希值得到文档对象的指纹信息,能够有效避免哈希碰撞,提高生成的指纹信息的精度。
技术关键词
对象
可执行程序代码
数据处理方法
指纹
关节点
语义特征
哈希算法
噪声
覆盖率
事件监听器
数据处理设备
可读存储介质
层级
视觉
处理器
密度
关键词
存储器