基于大数据文件集群的文件模糊拷贝方法及系统

正文

推荐专利

申请号：CN202510243632

申请日期：2025-03-03

公开号：CN119739537B

公开日期：2025-07-15

类型：发明专利

摘要

本发明提供基于大数据文件集群的文件模糊拷贝方法及系统，涉及文件拷贝技术领域，包括对待匹配文件集提取文件内容、文件名和元数据特征向量，其中，文件内容特征向量基于深度学习模型编码获得。之后，利用分布式计算框架并行计算待匹配文件与目标文件集中文件的相似度得分，该得分通过加权计算文件内容、文件名和元数据特征向量相似度获得，并根据预设阈值筛选生成待复制文件列表。最后，分布式文件系统根据系统资源动态分配复制任务，基于数据块级别并行传输机制执行文件复制，并校验数据完整性，生成复制任务执行报告。本发明能够高效、准确地在大数据文件集群中进行模糊文件拷贝，提高了文件拷贝效率和准确性，降低了系统资源消耗。

技术关键词

分布式计算框架任务调度器分布式文件系统状态转换概率节点深度学习模型资源状态信息编码错误率前馈神经网络文件拷贝技术计算机程序指令校验数据完整性分布式调度器进程数据一致性校验矩阵

系统为您推荐了相关专利信息

一种基于静止气象卫星的对流初生预测方法、装置及系统

云团静止气象卫星因子像素点多层感知机

一种实现服务链快速绕行保护的方法及设备

智能网卡虚拟化管理平台标识符节点处理器

一种复杂电子装备系统集成制造过程建模方法

BOM结构关系有向无环图节点生成订单

一种基于遗传算法的路径优化方法

遗传算法联运路径优化方法策略节点转运设备

一种都市圈城市轨道交通云平台、实现方法、设备及介质

中心云平台线网节点线路统一网络管理

基于大数据文件集群的文件模糊拷贝方法及系统

站点导航

APP 下载