一种基于上下文内容感知的文件碎片类型识别方法

正文

推荐专利

申请号：CN202510056363

申请日期：2025-01-14

公开号：CN119989043A

公开日期：2025-05-13

类型：发明专利

摘要

本发明涉及一种基于上下文内容感知的文件碎片类型识别方法，旨在解决在硬盘的数据恢复中，现有恢复方法无法充分利用文件碎片之间上下文关系的问题。由于相邻文件碎片通常来自同一文件或具有相似的文件类型，文件碎片间的相邻关系能够为数据恢复提供关键线索。BERT模型以其在自然语言序列处理中的强大上下文建模能力，在捕获复杂序列间的依赖关系方面具有显著优势。本发明将BERT的这一特点迁移到文件碎片序列领域，结合BiLSTM模型进一步挖掘文件碎片的上下文关联性。该方法通过对存储环境中实际存在的文件碎片上下文关系进行建模与学习，精准识别不同类型的文件碎片。为个人数据的安全恢复提供了一种高效且可靠的解决方案。

技术关键词

识别方法 BiLSTM模型概率分布函数概率密度函数 Softmax函数多任务学习模型滑动窗口机制文件系统存储块 BERT模型模拟硬盘卷积编码器模型超参数特征提取网络独立特征序列识别关系建模

一种基于上下文内容感知的文件碎片类型识别方法

站点导航

APP 下载