摘要
本申请实施例公开了数据智能采集方法、装置、计算机设备及存储介质。数据智能采集方法应用于数据智能采集系统,数据智能采集系统包括RPA组件以及数据处理大模型,方法包括:RPA组件获取目标网页的网页源代码,并将网页源代码发送至数据处理大模型;数据处理大模型根据网页源代码确定RPA组件的采集脚本,并将采集脚本发送至RPA组件;RPA组件基于采集脚本对目标网页进行多模态信息采集,得到目标网页对应的多模态数据;数据处理大模型对多模态数据进行数据融合与验证处理,采集得到目标网页对应的目标网页数据。通过实施本申请实施例的方法可以使RPA组件动态适应网页结构变化进行网页数据自动化采集。
技术关键词
数据智能采集系统
数据智能采集方法
文本关键信息
多模态信息
脚本
图像特征信息
字段
计算机设备
元素
序列
NLP技术
网页结构
处理器
解析工具
关键词
网址
密钥
系统为您推荐了相关专利信息
数据库构建方法
三元组
大语言模型
电催化析氢材料
文本
知识图谱推理方法
大语言模型
时序
微调技术
模板
子模块
筛选方法
滑动平均值算法
筛选系统
深度神经网络算法