摘要
本申请公开了网页信息提取方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及自然语言处理、深度学习、大模型等人工智能领域。具体实现方案为:获取搜索关键词对应的搜索结果网页的第一网页地址;根据第一网页地址,采用机器人自动化流程RPA获取搜索结果网页的第一网页源码;对第一网页源码进行解析,获取搜索结果网页中目标子网页的网页属性信息;根据网页属性信息中目标子网页的第二网页地址,采用RPA获取目标子网页的第二网页源码;根据第二网页源码,获取目标子网页的网页关键信息;根据网页关键信息,生成目标文档。
技术关键词
网页信息提取方法
关键词
标记
模板
机器人
电子设备
计算机程序产品
处理器通信
模块
自然语言
指令
可读存储介质
存储器
场景
系统为您推荐了相关专利信息
芯片测试方法
可视化界面
芯片测试装置
服务器
计算机程序产品
可视化监测装置
涂覆机器人
外壳端盖
修补胶液
深沟球轴承