基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品

AITNT
正文
推荐专利
基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品
申请号:CN202510466015
申请日期:2025-04-15
公开号:CN119988713B
公开日期:2025-06-27
类型:发明专利
摘要
本申请公开了一种基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品,涉及数据处理技术领域。上述方法通过接收用户输入的搜索指令,将搜索指令输入训练好的语义解析模型,在语义解析模型将搜索指令转换为查询参数后,将查询参数发送至搜索引擎,然后,接收搜索引擎根据查询参数获取的网页,并根据预设筛选规则从网页中确定目标网页,基于预先获取的授权结果,爬取目标网页的HTML源代码,将HTML源代码输入训练好的LLM模型,在LLM模型根据HTML源代码确定目标代码标签后,得到目标代码标签内的文本内容。其中,LLM模型具备强大的语言理解能力,可以动态适应网页结构的变化,降低了爬取网页内容的时间成本。
技术关键词
标签 语义 节点 计算机程序产品 指令 命名体识别 参数 网页结构 元素 数据处理技术 处理器 关系 文本 聚类 可读存储介质 存储器 词语 分词
系统为您推荐了相关专利信息
1
系统安全启动方法、装置、电子设备及存储介质
编程存储器 固件 系统安全启动方法 动态验证信息 加密算法
2
一种道路识别方法、装置、计算机设备及存储介质
道路识别方法 神经网络模型 样本 数据 道路特征
3
一种无导航最远可行路径规划方法、系统、设备和介质
路径规划方法 轨迹 栅格地图构建 车辆碰撞条件 加速度
4
基于CUDA的并行化BVH最小距离查询方法
查询方法 节点 批量 先进先出队列 记忆
5
一种储能系统运行智能控制系统
储能系统 智能控制系统 指标 序列 协同通信
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号