摘要
本发明公开了一种基于困难样本对比学习的少样本关系抽取方法,属于信息抽取技术领域。本发明针对现有技术在训练数据匮乏时难以充分捕捉关系语义特征、进而限制模型泛化能力的问题,提出了一种应用于极少样本的核心词保留增强方法,该方法通过提取样本中的核心词,并随机替换非核心词以生成保留核心词的新样本,从而有效提升模型在极少样本条件下的泛化能力。本发明针对现有技术缺乏对困难样本的挖掘、导致模型细粒度语义辨别能力受限的问题,提出了一种困难样本对比学习方法,该方法能够从有限的训练样本中动态识别出困难样本,并构建具有挑战性的正负样本对进行对比学习,显著增强模型在低资源场景下的细粒度关系判别性能。
技术关键词
关系抽取方法
样本
预训练语言模型
关系抽取模型
标签
高斯混合模型
生成对抗网络
实体
核心
信息抽取技术
语义
文本
同义词库
超参数
词频统计
训练集
学习方法
编码器
系统为您推荐了相关专利信息
BiLSTM模型
前馈神经网络
跨度
ResNet网络
双向长短期记忆网络
故障识别方法
跨模态
注意力机制
特征提取模块
数据
建立分类模型
组织
推演方法
机器学习算法
特征工程方法