一种网页信息分类方法、装置及存储介质

正文

推荐专利

一种网页信息分类方法、装置及存储介质

申请号：CN202411481452

申请日期：2024-10-23

公开号：CN119003920A

公开日期：2024-11-22

类型：发明专利

摘要

本申请公开了一种网页信息分类方法、装置及存储介质，用于信息分类领域。本申请方法包括：使用Python的Scrapy库从目标网页获取网页中的静态数据；使用Selenium自动化工具从目标网页获取网页的动态数据；基于所述静态数据和所述动态数据构建DOM树形结构；使用XLM‑RoBERTa预训练语言模型对已构建DOM树形结构的所述静态数据和所述动态数据进行向量化，转化为数值向量；将DOM树形结构转换为图结构，并将数值向量输入卷积图神经网络模型中，通过卷积图神经网络模型对图结构进行编码，生成特征向量；将所述特征向量输入预配置的分类模型中进行计算，通过预配置的分类模型对所述静态数据和所述动态数据进行分类。

技术关键词

网页信息分类方法树形结构自动化工具神经网络模型生成特征向量训练语言模型信息分类装置输入输出单元数值深度优先遍历列表节点可读存储介质样本编码申请方法算法数据存储器程序

系统为您推荐了相关专利信息

一种基于神经网络模型的多维度QPCR结果分析系统

基因样本堆叠神经网络分析系统模板

电池SOH估计模型训练方法、SOH估计方法及系统

人工神经网络模型锂离子电池模型训练方法 SOH估计方法标签

基于pyside2和MySQL的冷链仓储智能节能平台的实现方法

仓储智能数据显示界面融霜电能采集模块 Modbus通信协议

一种鳜鱼预制菜品检测方法、系统及计算机可读存储介质

菜品检测方法样本凝胶强度神经网络模型

基于CPO-VMD与CNN-BiLSTM的变压器振动状态监测方法、系统、设备及介质

振动状态监测变压器元启发式算法计算机可执行指令负荷

一种网页信息分类方法、装置及存储介质

站点导航

APP 下载