摘要
本发明公开了一种基于数据增强和优先级约束的知识抽取方法、系统、终端及存储介质,所述方法包括:获取初始文本数据,并对初始文本数据进行数据增强处理,得到增强文本数据;确定预训练语言模型和非自回归模型,通过预训练语言模型对增强文本数据进行文本编码处理,并通过非自回归模型进行模型训练,得到知识抽取模型;获取当前文本数据,通过所述知识抽取模型对所述当前文本数据进行三元组知识抽取处理,得到目标三元组知识抽取结果。本发明通过对初始文本数据进行数据增强处理,有效缓解了数据稀疏性以及三元组知识关系实例的多样性不足的问题,并通过增强文本数据对非自回归模型进行训练,有效提高了知识抽取模型的知识抽取精度。
技术关键词
知识抽取方法
预训练语言模型
三元组
文本
数据
注意力
关系
上下文特征
抽取系统
动态
约束优化方法
解码器
模型训练模块
可读存储介质
编码
处理器
终端
程序
存储器
计算机