网页文章内容提取及目标模型训练方法和装置

AITNT
正文
推荐专利
网页文章内容提取及目标模型训练方法和装置
申请号:CN202410955105
申请日期:2024-07-16
公开号:CN119025734A
公开日期:2024-11-26
类型:发明专利
摘要
本公开提供了网页文章内容提取及目标模型训练方法和装置,涉及深度学习、大模型以及自然语言处理等人工智能领域。其中的网页文章内容提取方法可包括:获取待处理网页,待处理网页中包括文章形式的网页数据;将待处理网页作为目标模型的输入,得到目标模型输出的网页文章内容提取结果,所述目标模型为对预训练的大语言模型进行微调后得到的。应用本公开所述方案,可节省人力和时间成本,并可提升处理效率及提升得到的网页文章内容提取结果的准确性等。
技术关键词
模型训练模块 训练样本集 文章 模型训练方法 抓取网页 大语言模型 模型训练装置 指令 格式 计算机程序产品 标记 数据 处理器通信 自然语言 站点 可读存储介质 存储器
系统为您推荐了相关专利信息
1
基于数据增强和对比学习的雷达一维像小样本模型训练方法
模型训练方法 深度学习网络模型 样本 雷达 深度学习识别模型
2
一种复合管界面分层应变的预测方法及相关设备
覆层 参数 接触面 分层 计算机执行指令
3
一种基于组织组学的癌症预后模型训练方法、装置及预测方法
癌症预后预测方法 模型训练方法 分类网络训练 图谱 数据
4
一种有损图像编码方法、设备、介质及产品
图像编码方法 编码压缩图像 图像压缩 变换块 训练样本集
5
一种基于技能驱动的人类偏好行为的应用方法及装置
强化学习模型 轨迹 无监督 人类 扩展智能
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号