摘要
本发明涉及一种基于上下文内容感知的文件碎片类型识别方法,旨在解决在硬盘的数据恢复中,现有恢复方法无法充分利用文件碎片之间上下文关系的问题。由于相邻文件碎片通常来自同一文件或具有相似的文件类型,文件碎片间的相邻关系能够为数据恢复提供关键线索。BERT模型以其在自然语言序列处理中的强大上下文建模能力,在捕获复杂序列间的依赖关系方面具有显著优势。本发明将BERT的这一特点迁移到文件碎片序列领域,结合BiLSTM模型进一步挖掘文件碎片的上下文关联性。该方法通过对存储环境中实际存在的文件碎片上下文关系进行建模与学习,精准识别不同类型的文件碎片。为个人数据的安全恢复提供了一种高效且可靠的解决方案。
技术关键词
识别方法
BiLSTM模型
概率分布函数
概率密度函数
Softmax函数
多任务学习模型
滑动窗口机制
文件系统
存储块
BERT模型
模拟硬盘
卷积编码器
模型超参数
特征提取网络
独立特征
序列识别
关系建模