摘要
本发明属于网络数据处理技术领域,尤其涉及一种基于人工智能的网络数据抓取与异常检测方法。针对现有技术在网络数据处理方面的不足,本发明先筛选初始URL列表去除无效低价值URL,再用融合CNN与RNN优势的模型识别网页数据区域,以动态XPath算法生成提取路径,接着用多粒度哈希算法计算指纹对比差异,最后结合改进DBN和IF算法检测数据异常。本发明能适应复杂网页结构变化,准确抓取数据,精确识别数据更新或新增,有效检测异常模式,提高数据处理效率、准确性与安全性,为网络数据处理提供可靠解决方案。
技术关键词
异常检测方法
网页结构
深度信念网络
节点
指纹
联合损失函数
语义标签
哈希算法
网络数据处理技术
网页元素
数据更新
重构误差
生成算法
表达式
异常数据
生成器网络
系统为您推荐了相关专利信息
贝叶斯神经网络
概率预测方法
原油
油样
预测特征