摘要
本发明公开了一种基于服务网格的分布式爬虫方法、介质和设备,该方法包括:若单位时间内失败请求的占比超过了预设比例,则触发熔断机制,自动熔断对目标网站的所有爬虫请求;以及在满足熔断恢复条件后,重新接收第一数量的爬虫请求,统计目标网站对第一数量的爬虫请求的第一响应成功率,若第一响应成功率大于预设第一成功率,则重新接收第二数量的爬虫请求,统计目标网站对第二数量的爬虫请求的第二响应成功率,若第二响应成功率大于预设第二成功率,则停止熔断机制,恢复目标网站对所有爬虫请求的响应,第二数量大于第一数量。通过设置熔断机制可以有效防止因为某个网站的问题导致整个爬虫系统瘫痪,提升爬虫的稳定性。
技术关键词
分布式爬虫
神经网络模型
样本
网格
爬虫系统
机制
动态更新
列表
处理器
标记
可读存储介质
电子设备
时间段
计算机
程序
系统为您推荐了相关专利信息
仿真方法
埋地燃气管道
土壤物理参数
管道运行参数
方程
样本
非暂态计算机可读存储介质
大语言模型
轨迹
处理器
预训练模型
表格
机器学习算法
数据生成技术
框架