摘要
本申请实施例提供了一种信息获取方法、装置及电子设备,涉及计算机技术领域。信息获取方法包括:获取第一网页的网页地址;采集所述第一网页的网页地址对应的第一原始网页信息;根据信息提取规则,从所述第一原始网页信息中提取第一网页信息,所述信息提取规则是通过大语言模型,根据内容描述信息和第二网页的第二原始网页信息生成的数据,所述内容描述信息指示从网页所需获取的网页信息。本申请可以提升对多变的网页结构的适应能力,提高网页信息提取效率。
技术关键词
信息提取规则
大语言模型
信息获取方法
网页结构
网页信息提取
信息获取装置
通信接口
电子设备
动态网页
处理器
存储器
计算机程序产品
可读存储介质
数据
模块
指令
页面
语义
系统为您推荐了相关专利信息
文本
信息检索方法
信息检索设备
信息检索装置
可读存储介质
地图生成方法
动态地图
路径规划功能
生成路线
节点
文本分类方法
分块
语义标签
计算机程序产品
聚类
大语言模型
文本处理模型
文本处理方法
模型训练方法
融合特征