基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510466015

申请日期：2025-04-15

公开号：CN119988713B

公开日期：2025-06-27

类型：发明专利

摘要

本申请公开了一种基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品，涉及数据处理技术领域。上述方法通过接收用户输入的搜索指令，将搜索指令输入训练好的语义解析模型，在语义解析模型将搜索指令转换为查询参数后，将查询参数发送至搜索引擎，然后，接收搜索引擎根据查询参数获取的网页，并根据预设筛选规则从网页中确定目标网页，基于预先获取的授权结果，爬取目标网页的HTML源代码，将HTML源代码输入训练好的LLM模型，在LLM模型根据HTML源代码确定目标代码标签后，得到目标代码标签内的文本内容。其中，LLM模型具备强大的语言理解能力，可以动态适应网页结构的变化，降低了爬取网页内容的时间成本。

技术关键词

标签语义节点计算机程序产品指令命名体识别参数网页结构元素数据处理技术处理器关系文本聚类可读存储介质存储器词语分词

系统为您推荐了相关专利信息

系统安全启动方法、装置、电子设备及存储介质

编程存储器固件系统安全启动方法动态验证信息加密算法

一种道路识别方法、装置、计算机设备及存储介质

道路识别方法神经网络模型样本数据道路特征

一种无导航最远可行路径规划方法、系统、设备和介质

路径规划方法轨迹栅格地图构建车辆碰撞条件加速度

基于CUDA的并行化BVH最小距离查询方法

查询方法节点批量先进先出队列记忆

一种储能系统运行智能控制系统

储能系统智能控制系统指标序列协同通信

基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品

站点导航

APP 下载