摘要
本申请涉及数据处理技术领域,公开了一种基于网页结构判别动静态网页类型的方法,该方法包括:先收集动静态网页样本并分析其结构特征,据此构建动态与静态网页识别指令并生成网页类型判别器;再利用该判别器对待识别网页的目标结构执行两类识别指令,分别得出其属于动静态网页的置信度;最后依据置信度高低或与预设阈值对比,精准判别待识别网页类型,为多场景应用提供准确依据。本申请突破传统仅依赖URL规则或简单请求筛选的局限,从网页结构特征出发,构建识别指令与判别器,对动静态网页进行针对性结构分析,有效避免伪静态网页等特殊情况带来的误判,提升判别准确性。
技术关键词
静态网页
识别网页
静态特征
随机森林模型
网页结构
动态网页内容
生成网页
样本
动静态
指令
标签特征
数据流特征
专家系统
识别页面
动态页面技术
系统为您推荐了相关专利信息
历史运行数据
智能断路器
在线监测方法
工作特征
波形
前端开发方法
图像识别技术
元素
图像识别模块
文本