基于大语言模型与MCP协议的智能爬虫生成方法及系统

正文

推荐专利

申请号：CN202511016153

申请日期：2025-07-23

公开号：CN120910335A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了基于大语言模型与MCP协议的智能爬虫生成方法及系统，属于网络数据采集技术领域，解决了现有技术无法有效整合LLM与浏览器交互协议，导致无法充分发挥LLM在动态网页解析、反爬策略生成环节能力的问题，方法包括基于大语言模型解析所述采集需求并生成标准化的需求描述文档，基于MCP协议实现大语言模型与浏览器的交互，通过爬虫脚本生成系统对页面完整DOM树结构解析处理，对生成的爬虫脚本进行质量校验与智能修复；本发明中通过MCP协议获取浏览器渲染后的完整DOM树及动态数据，且能够调用大语言模型自动分析元素定位策略，从而自适应生成采集脚本，保证了网页数据采集的高效化、智能化与自动化。

技术关键词

大语言模型 DOM树结构爬虫脚本协议生成方法浏览器页面 Chrome浏览器生成系统鉴权参数定位策略定制化数据校验系统语义网络数据采集技术自然语言模块监测页面非结构化数据存储

系统为您推荐了相关专利信息

一种基于大语言模型协同的越南语依存句法数据增强方法

依存句法树大语言模型数据依存句法分析解析句子

在AnyLogic软件环境中运行R语言并部署机器学习算法的方法

机器学习算法机器学习方法预测 Java类插件通信规范

一种应用于车载无线充的智能管控方法及系统

充电设备充电策略智能管控方法车载端融合特征提取

一种多视角语义量化推荐方法及系统

推荐方法多视角物品流行度排序损失语义特征

基于分层记忆与关联图谱的大模型上下文控制系统及方法

摘要大语言模型控制系统记忆图谱

基于大语言模型与MCP协议的智能爬虫生成方法及系统

站点导航

APP 下载