一种信息抽取方法、装置和设备

正文

推荐专利

一种信息抽取方法、装置和设备

申请号：CN202510592367

申请日期：2025-05-08

公开号：CN120632241A

公开日期：2025-09-12

类型：发明专利

摘要

本申请公开了一种信息抽取方法、装置、电子设备和存储介质，包括：获取目标网页的超文本标记语言HTML数据，并提取出HTML数据中的非结构化数据；对非结构化数据进行自然语言处理，构建知识图谱，其中，知识图谱中的节点表示非结构化数据中的实体；基于图卷积网络对知识图谱进行知识推理，确定实体间的隐含关系，并基于隐含关系对知识图谱进行优化，得到目标网页的信息抽取结果。通过自动化流程获取并处理目标网页的HTML数据，能够大幅提升信息抽取的效率，有效应对海量数据的挑战，而且，基于自然语言处理和图卷积网络进行知识图谱构建与推理，不仅实现了处理过程的标准化，确保了结果的一致性，减少了主观判断的影响，还提升了信息抽取的准确性。

技术关键词

信息抽取方法构建知识图谱网页元素超文本标记语言自然语言关系数据存储单元表格文档对象模型语义知识图谱构建命名实体识别可读存储介质网络节点抽取装置处理器

系统为您推荐了相关专利信息

一种涉侵权数据管理方法及系统

数据分类数据管理方法数据处理系统关键词量子密钥分发技术

一种基于情感检索与角色一致性控制的影视角色扮演方法

角色扮演方法语义向量实体自然语言计算机终端设备

基于对比学习的长文本表征加速系统及方法

加速系统语义理解模型多尺度命名实体识别匹配模块

一种多源城市数据的人才数据竞争力匹配方法

多源城市数据职业评分机制关键词标签

基于大模型技术的书籍检索方法、装置、设备和介质

图书图像书籍检索装置转换文本检索方法

一种信息抽取方法、装置和设备

站点导航

APP 下载