摘要
本发明涉及自然语言处理领域,提供了一种实体对表征方法及采用其的少样本文档级关系抽取方法,其中,实体对表征方法,通过实体的注意力分数,计算实体对的注意力分数;以实体对的注意力分数作为权值,加权文档的上下文嵌入,得到更强调于当前实体对的上下文表征;之后,将上下文表征与对应实体的实体嵌入进行融合,获得保留了细粒度实体语义和全局依赖信息的实体表征,并以此构建实体对表征;少样本文档级关系抽取方法,采用上述方法构建的实体对表征,通过向量组形式的关系原型,保留实例级分布的多样性,并以向量组中最大值作为最终的匹配度,减少噪声对计算的影响,因此,解决了关系原型语义不充分导致分类混淆的问题。
技术关键词
关系抽取方法
注意力
原型
三元组
表征方法
预训练语言模型
样本
特征提取模块
文本
相似性度量函数
细粒度实体
关系抽取模型
矩阵
标记
语义
序列
字典
系统为您推荐了相关专利信息
故障预测数据
故障诊断模型
双向长短期记忆
故障诊断方法
注意力机制
细粒度图像分类
图像获取模块
多尺度特征
图像类别
图像分类技术