摘要
本公开提供了一种基于大语言模型的网页解析代码生成方法、装置和设备,涉及自然语言处理、网页解析等技术领域。该方法包括:通过第一大语言模型,根据网页解析任务的需求文本确定关键信息字段,将所述关键信息字段填入结构化的解析提示模板中得到解析提示文本;所述关键信息字段包括如下至少一项:目标网站的域名、目标网页类型、目标网页结构和目标数据字段;通过第二大语言模型,根据所述解析提示文本生成网页解析任务的解析代码。
技术关键词
大语言模型
网页结构
解析代码生成方法
文本
数据字
文档对象模型
摘要
字段
生成网页
元素定位技术
相邻节点关系
格式
代码生成装置
标准化接口
模板
处理器
标签
计算机程序产品
系统为您推荐了相关专利信息
实体
文本
知识检索方法
语义特征提取
知识图谱构建
画像
推荐系统
车辆特征库
标签特征
车辆特征提取
推荐展示方法
三维可视化引擎
多源异构数据
多模态特征融合
展示界面