摘要
本发明公开一种基于数据增强的威胁情报三元组联合抽取方法,包括:数据增强方法,负责通过基于大模型的数据增强方法,对威胁情报领域少量数据进行多粒度高质量扩充。句法信息融合方法:负责将输入句子解析为成分树和依存树,通过结合Tree‑GRU的句法融合算法将其中的信息抽取得到句法依赖矩阵,融入抽取模型,增强其对显式文本结构和语义的理解。填表抽取方法:负责通过基于填表法的联合抽取算法将句子中的实体和关系在同一张表中同时表示和抽取,以增强实体和关系之间的交互,并在训练中引入基于MDA方法的对抗训练机制来增强模型的鲁棒性和泛化能力。本发明为解决网络威胁情报三元组抽取领域标签不足问题和复杂长难句抽取提供了新的设计思路。
技术关键词
联合抽取方法
三元组
网络威胁情报
依存句法
多头注意力机制
BERT模型
实体
矩阵
句法信息
语义特征
顶点
动态调节步长
解码
数据
大语言模型
样本
提示方法
策略