摘要
本发明提供的基于GNN学习的电子商务反爬虫对抗爬取方法、装置及设备,涉及数据爬取技术领域。本发明根据电子商务网站的历史数据构建初始异构图,并采用多层次并行图卷积操作生成节点和边的多尺度嵌入向量,构建多层次图神经网络;引入跨层次融合注意力和层级门控机制对多层次图神经网络的每一层进行层内自注意力处理并动态调整不同层次的权重分配;再进行多尺度嵌入向量的跨层融合,同时引入Transformer模块得到最终嵌入向量;通过实时获取网站反馈信息更新多层次图神经网络,并生成当前状态空间嵌入向量;最后,结合奖励函数进行电子商务网站爬取结果的评价分析,以实时调整网站反爬策略。本发明能够实现对电子商务网站环境状态的实时感知与动态优化。
技术关键词
爬取方法
多层次
反爬虫
表达式
页面内容
节点特征
多尺度
异构
人类特征
信息更新
数据爬取技术
动态
增量更新
注意力机制
层级
神经网络单元
神经网络结构
前馈神经网络
系统为您推荐了相关专利信息
网络边缘缓存方法
协作缓存策略
深度强化学习模型
邻居
时延
三维模型分类方法
分类网络
注意力
渲染三维模型
多角度
眼科模型
模态预测方法
令牌
文本编码器
图像编码器
孔隙结构
多组分气体
渗流模型
耦合模拟方法
天然气
知识图谱自动构建方法
节点
医学知识图谱
实体
坐标