摘要
本发明公开了一种基于无监督方式的小众领域英文关系抽取方法,包括S1、获取小众领域的英文文本数据;S2、对所述英文文本数据进行预处理;S3、利用E2E模型进行指代消解;S4、通过T5模型从预处理后的英文文本数据中抽取不同种类的实体内容;S5、在依存句法分析的基础上,抽取英文文本数据中的关系三元组;S6、将抽取的关系三元组与步骤S4中提取的实体内容进行匹配;S7、根据用户提供的实体字典,对匹配的关系三元组进行过滤;S8、对获取的关系三元组进行规则过滤;S9、对过滤后的关系三元组进行无监督聚类分析;S10、形成最终的关系抽取结果。本发明采用无监督学习方法,避免了对大量标注数据的依赖,减少了人工标注的高昂费用。
技术关键词
三元组
关系抽取方法
实体
文本
依存句法分析
词语
无监督聚类分析
字典
数据
识别算法
分词算法
无监督学习方法
标签
语义
多层次
前馈神经网络