重复文件的检测方法及装置、存储介质、计算机设备

AITNT
正文
推荐专利
重复文件的检测方法及装置、存储介质、计算机设备
申请号:CN202411915100
申请日期:2024-12-24
公开号:CN119938608A
公开日期:2025-05-06
类型:发明专利
摘要
本申请公开了一种重复文件的检测方法及装置、存储介质、计算机设备,该方法包括:响应于重复文件的检测指令,获取待进行重复检测的多个文件,并根据文件类型,对所述多个文件进行分类,对每个分类下的文件按照文件大小进行分组,得到每个分类下的多个文件组;对于每个包含多个文件的目标文件组,根据所述目标文件组对应的文件类型,确定所述目标文件组对应的特定特征维度,并根据所述特定特征维度以及通用特征维度,对所述目标文件组中的每个文件进行特征提取,得到各文件对应的目标特征向量,根据所述目标特征向量,确定所述目标文件组中是否存在重复文件;输出各分类下的重复文件检测结果。
技术关键词
通用特征 梅尔频率倒谱系数 文本段落 语义特征 采样率 语义角色 计算机设备 分辨率 傅里叶变换方法 词嵌入模型 命名实体识别 图像 特征提取方法 离散余弦变换 滤波器 词袋模型 频谱特征 处理器
系统为您推荐了相关专利信息
1
一种服务推荐及提供商品对象信息的方法
商品对象信息 自然语义 音频特征 存储程序指令 图像
2
基于知识检索增强的视觉问答方法
视觉问答方法 图像编码器 多模态 答案 文本段落
3
一种信息安全等级保护测评系统及方法
系统日志 长短期记忆网络 信息安全等级保护 信息系统 数据保护
4
基于大型语言模型的多尺度海浪波高预测方法及系统
海浪波高预测方法 动态融合机制 编码特征 语义信息提取 注意力机制
5
基于无人机的光伏阵列运行状态监控系统及方法
光伏板 语义关联度 状态监控系统 光伏阵列 无人机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号