一种基于数据增强和优先级约束的知识抽取方法、系统、终端及存储介质

正文

推荐专利

申请号：CN202510516881

申请日期：2025-04-23

公开号：CN120654788A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了一种基于数据增强和优先级约束的知识抽取方法、系统、终端及存储介质，所述方法包括：获取初始文本数据，并对初始文本数据进行数据增强处理，得到增强文本数据；确定预训练语言模型和非自回归模型，通过预训练语言模型对增强文本数据进行文本编码处理，并通过非自回归模型进行模型训练，得到知识抽取模型；获取当前文本数据，通过所述知识抽取模型对所述当前文本数据进行三元组知识抽取处理，得到目标三元组知识抽取结果。本发明通过对初始文本数据进行数据增强处理，有效缓解了数据稀疏性以及三元组知识关系实例的多样性不足的问题，并通过增强文本数据对非自回归模型进行训练，有效提高了知识抽取模型的知识抽取精度。

技术关键词

知识抽取方法预训练语言模型三元组文本数据注意力关系上下文特征抽取系统动态约束优化方法解码器模型训练模块可读存储介质编码处理器终端程序存储器计算机

一种基于数据增强和优先级约束的知识抽取方法、系统、终端及存储介质

站点导航

APP 下载