摘要
本发明实施例提供一种网站信息提取方法、装置、系统,包括:获取目标网站的地址信息以及用户输入的对应目标内容语言描述数据;基于所述目标内容语言描述数据以及目标网站的页面布局数据,对至少一个所述地址信息内对应的链接数据进行识别匹配,确定至少一个目标链接数据;通过预设AI语言大模型,对所述目标链接数据进行提取处理,确定目标内容的信息。通过获取目标网站地址和用户输入的目标内容需求,结合页面布局数据识别匹配目标链接数据,并利用AI语言大模型提取目标内容信息,能够基于用户需求自动识别目标链接并通过AI语言大模型提取页面字段信息,提升网站信息提取的智能化水平和处理效率。
技术关键词
网站信息提取方法
网站信息提取装置
网站信息提取系统
数据
布局
数字型
页面字段
可读存储介质
处理器
电子设备
字母
地图
存储器
计算机
模块
层级
语义
嵌套