一种基于服务网格的分布式爬虫方法、介质和设备

AITNT
正文
推荐专利
一种基于服务网格的分布式爬虫方法、介质和设备
申请号:CN202411436418
申请日期:2024-10-15
公开号:CN119397077A
公开日期:2025-02-07
类型:发明专利
摘要
本发明公开了一种基于服务网格的分布式爬虫方法、介质和设备,该方法包括:若单位时间内失败请求的占比超过了预设比例,则触发熔断机制,自动熔断对目标网站的所有爬虫请求;以及在满足熔断恢复条件后,重新接收第一数量的爬虫请求,统计目标网站对第一数量的爬虫请求的第一响应成功率,若第一响应成功率大于预设第一成功率,则重新接收第二数量的爬虫请求,统计目标网站对第二数量的爬虫请求的第二响应成功率,若第二响应成功率大于预设第二成功率,则停止熔断机制,恢复目标网站对所有爬虫请求的响应,第二数量大于第一数量。通过设置熔断机制可以有效防止因为某个网站的问题导致整个爬虫系统瘫痪,提升爬虫的稳定性。
技术关键词
分布式爬虫 神经网络模型 样本 网格 爬虫系统 机制 动态更新 列表 处理器 标记 可读存储介质 电子设备 时间段 计算机 程序
系统为您推荐了相关专利信息
1
一种基于多元信息数据和分层耦合模块的磷虾渔场高精度预测模型的构建方法
磷虾渔业 分层 模块 专家知识经验 高时空分辨率
2
一种埋地燃气管道泄漏扩散多因融合仿真方法及系统
仿真方法 埋地燃气管道 土壤物理参数 管道运行参数 方程
3
基于大模型的方案生成与优化模型的训练方法及其装置
样本 非暂态计算机可读存储介质 大语言模型 轨迹 处理器
4
一种质检方法、装置、电子设备、计算机可读存储介质及程序产品
文本 质检模型 质检方法 计算机程序指令 多模态
5
一种基于可解释性的条件表格GAN建立方法
预训练模型 表格 机器学习算法 数据生成技术 框架
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号