摘要
本发明公开一种基于多样本增强的非结构化文本持续关系抽取方法、装置、介质及产品,方法包括:通过采用对比学习损失函数,对预训练的编码器进行训练,获得一次训练后的编码器;进而计算得到语料训练集中每个语料样本的关系嵌入表示向量;然后对语料训练集中的语料样本进行聚类,并获取每一类中距离聚类中心最近的语料样本,添加至记忆库;并采用对比学习损失函数和原型相似度损失函数,对一次训练后的编码器进行训练,获得二次训练后的编码器;利用二次训练后的编码器对当前任务中的非结构化文本持续关系进行抽取。本发明通过对比学习的记忆回放策略,缓解了非结构化文本持续关系抽取中的灾难性遗忘的问题,可以持续高效地完成关系抽取任务。
技术关键词
关系抽取方法
样本
记忆
原型
编码器
文本
训练集
度量
聚类
实体
超参数
处理器
计算机装置
标签
计算机程序产品
可读存储介质
存储器
线性
算法
系统为您推荐了相关专利信息
全局特征描述子
无人机
影像检索方法
生成训练样本
三维重建模型
图像超分辨率方法
多层次特征
记忆
网络
融合语义信息
逻辑回归算法
逻辑回归模型
数据
长短期记忆网络
训练集
信道接入方法
智能抗干扰
决策
特征提取模块
发射机
智慧监管系统
故障案例库
异常事件
固体危险废物
长短期记忆网络