基于知识注入和图神经网络的开放域文本信息抽取方法

正文

推荐专利

申请号：CN202510586238

申请日期：2025-05-08

公开号：CN120523963A

公开日期：2025-08-22

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，公开了一种基于知识注入和图神经网络的开放域文本信息抽取方法，包括对输入文本数据提取所有名词性短语构建候选实体集合；将候选实体两两组合，构建每个实体对的自注意力关联矩阵；对自注意力关联矩阵进行序列采样，生成候选三元组序列集合；对候选三元组序列与输入文本数据计算语义相似度，输出前k个高关联三元组序列作为输入文本数据的初始信息抽取结果；基于图神经网络对初始信息抽取结果进行依存结构分析，通过冗余序列标注生成三元组序列，作为最终信息抽取结果。本发明显著提升了开放域信息抽取任务中复杂句法结构三元组的识别率，同时有效降低了抽取结果的冗余度。

技术关键词

文本信息抽取方法三元组序列预训练语言模型实体语义向量自然语言文本数据提取句法结构神经网络模型编码注意力机制冗余度策略

系统为您推荐了相关专利信息

课堂数据的识别方法、装置、电子设备和存储介质

数据识别方法文本术语音频

一种低介电玻璃纤维的纤维拉丝温控系统

低介电玻璃纤维温控系统纤维漏板理论曲线

基于数字孪生驱动的多缸液压设备数据交互系统

液压设备数字孪生驱动数据交互系统数字孪生模型设备运行状态

一种知识嵌入强化学习方法及模型推理方法

标签文本实体强化学习方法数据

一种基于多源数据同步耦合分析的滞气爆管风险分级分类动态评估预警模型建立方法

预警模型建立方法数据同步风险强度管道

基于知识注入和图神经网络的开放域文本信息抽取方法

站点导航

APP 下载