一种基于数据增强的威胁情报三元组联合抽取方法

正文

推荐专利

申请号：CN202510233162

申请日期：2025-02-28

公开号：CN120163161A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开一种基于数据增强的威胁情报三元组联合抽取方法，包括：数据增强方法，负责通过基于大模型的数据增强方法，对威胁情报领域少量数据进行多粒度高质量扩充。句法信息融合方法：负责将输入句子解析为成分树和依存树，通过结合Tree‑GRU的句法融合算法将其中的信息抽取得到句法依赖矩阵，融入抽取模型，增强其对显式文本结构和语义的理解。填表抽取方法：负责通过基于填表法的联合抽取算法将句子中的实体和关系在同一张表中同时表示和抽取，以增强实体和关系之间的交互，并在训练中引入基于MDA方法的对抗训练机制来增强模型的鲁棒性和泛化能力。本发明为解决网络威胁情报三元组抽取领域标签不足问题和复杂长难句抽取提供了新的设计思路。

技术关键词

联合抽取方法三元组网络威胁情报依存句法多头注意力机制 BERT模型实体矩阵句法信息语义特征顶点动态调节步长解码数据大语言模型样本提示方法策略

一种基于数据增强的威胁情报三元组联合抽取方法

站点导航

APP 下载