摘要
本申请公开了一种重复文件的检测方法及装置、存储介质、计算机设备,该方法包括:响应于重复文件的检测指令,获取待进行重复检测的多个文件,并根据文件类型,对所述多个文件进行分类,对每个分类下的文件按照文件大小进行分组,得到每个分类下的多个文件组;对于每个包含多个文件的目标文件组,根据所述目标文件组对应的文件类型,确定所述目标文件组对应的特定特征维度,并根据所述特定特征维度以及通用特征维度,对所述目标文件组中的每个文件进行特征提取,得到各文件对应的目标特征向量,根据所述目标特征向量,确定所述目标文件组中是否存在重复文件;输出各分类下的重复文件检测结果。
技术关键词
通用特征
梅尔频率倒谱系数
文本段落
语义特征
采样率
语义角色
计算机设备
分辨率
傅里叶变换方法
词嵌入模型
命名实体识别
图像
特征提取方法
离散余弦变换
滤波器
词袋模型
频谱特征
处理器
系统为您推荐了相关专利信息
商品对象信息
自然语义
音频特征
存储程序指令
图像
系统日志
长短期记忆网络
信息安全等级保护
信息系统
数据保护
海浪波高预测方法
动态融合机制
编码特征
语义信息提取
注意力机制
光伏板
语义关联度
状态监控系统
光伏阵列
无人机