摘要
本申请公开了一种自动化数据采集方法、系统和相关设备,方法包括:接收用户通过配置文件输入的待采集目标网站的账号与密码信息,并根据采集需求生成任务队列;利用Playwright框架提供的上下文隔离功能,在单个浏览器实例中创建独立的上下文环境,同时启动多个浏览器实例并进行数据隔离;利用Playwright框架提供的代码注入功能,在浏览器页面内部执行与待采集目标网站一致的加密算法,得到加密参数;根据所述任务队列生成并发起携带所述加密参数的API请求,以完成数据采集。本申请在并发性能、动态页面支持、安全性以及扩展性方面优于现有技术,尤其适合高并发、高动态复杂场景下的数据采集需求。
技术关键词
浏览器页面
加密算法
框架
数据采集模块
队列
参数
账号
数据采集设备
动态页面
计算机程序产品
处理器
密码
可读存储介质
存储器
系统为您推荐了相关专利信息
智慧工地管理系统
ZigBee通信芯片
三维加速度传感器
智能安全帽
可充电锂电池
节能控制方法
烘干设备
遗传算法优化
模拟模型
加热源
多模态深度学习
头颈
辅助分析方法
临床检查数据
智能辅助分析系统
组织特征数据
机器学习模型
控制系统
闭环
模型训练模块
激光器组件
PCB基板
激光器芯片
上壳体
收发模块