摘要
本发明涉及计算机技术领域,可应用于金融及医疗领域,公开了一种网页存档方法、装置、设备及介质,包括:获取待存档网页,并对待存档网页进行内容识别,得到目标网页数据;目标网页数据包括动态网页数据和静态网页数据;分别对动态网页数据和静态网页数据进行独立编码,得到动态编码数据以及静态编码数据;通过自适应算法对动态编码数据以及静态编码数据进行分析,并根据分析结果确定目标网页数据对应的网页存档格式;根据网页存档格式生成目标网页数据对应的目标存档文件,并将目标存档文件进行存储。本申请可保证网页内容完整性的同时,增强存档过程与金融应用的关联性,提升存档效率并确保数据的长期保存与合规性。
技术关键词
静态网页
动态网页
存档方法
数据模块
格式
复杂度
表单
云端存储系统
文档对象模型
算法
多媒体
存档装置
编码
网页结构
字体文件
可读存储介质
验证规则
处理器