摘要
本公开提供了网页文章内容提取及目标模型训练方法和装置,涉及深度学习、大模型以及自然语言处理等人工智能领域。其中的网页文章内容提取方法可包括:获取待处理网页,待处理网页中包括文章形式的网页数据;将待处理网页作为目标模型的输入,得到目标模型输出的网页文章内容提取结果,所述目标模型为对预训练的大语言模型进行微调后得到的。应用本公开所述方案,可节省人力和时间成本,并可提升处理效率及提升得到的网页文章内容提取结果的准确性等。
技术关键词
模型训练模块
训练样本集
文章
模型训练方法
抓取网页
大语言模型
模型训练装置
指令
格式
计算机程序产品
标记
数据
处理器通信
自然语言
站点
可读存储介质
存储器
系统为您推荐了相关专利信息
模型训练方法
深度学习网络模型
样本
雷达
深度学习识别模型
癌症预后预测方法
模型训练方法
分类网络训练
图谱
数据
图像编码方法
编码压缩图像
图像压缩
变换块
训练样本集