摘要
本发明公开了一种基于对比学习和差异化数据增强的关系抽取网络方法和装置,其方法针对远程监督关系抽取中存在的长尾分布问题,结合大语言模型生成的差异化增强样本与多层次对比学习机制,通过四个主要步骤提升尾部关系的抽取效果:首先,基于关系频率对样本进行划分,并采用分层提示与差异化采样生成增强样本;其次,构建句子级与包级编码器进行多层次语义建模;第三,构造正负样本对并引入对比学习目标提升表示判别能力;最后,联合优化包级损失与句子级对比损失,实现全局与局部特征的统一学习。本发明在提升尾部关系识别能力的同时保持整体性能稳定,能够有效缓解远程监督关系抽取中的类别不平衡问题,具有较强的实用价值和推广前景。
技术关键词
关系抽取方法
样本
编码器
大语言模型
原型
数据
多层次
BERT模型
实体
模型预训练
语义角色
生成结构
编码结构
抽取装置
语义向量
注意力机制
高温度
系统为您推荐了相关专利信息
样本
业务执行方法
模型训练方法
逻辑
业务执行装置
Apriori算法
关联分析系统
规则知识库
地下管廊
火灾特征
数值预测方法
BP神经网络
计算机可读程序
网络结构
编码器
多元遥感数据
压缩单元
图像处理模型
雷达
游程编码