摘要
本发明公开了一种基于伪孪生去噪网络的中文实体关系联合抽取方法,为弥补联合抽取任务对于语境信息和句法信息利用不充分问题,首先引入文本词性信息和依存句法信息进行先验特征学习,对生成的文本词性特征向量、文本语义特征向量和依存句法特征向量进行拼接和特征降维;将去噪门机制整合到孪生网络中,形成伪孪生网络,将特征降维后的特征向量分别输入到孪生网络和伪孪生网络中,对孪生网络获得的原始特征和伪孪生网络产生的去噪特征进行残差连接,形成伪孪生去噪网络,防止信息损失,并将其输入到关系导向网络执行联合抽取任务。通过伪孪生去噪网络可以很大程度上处理表示学习过程中产生的噪音特征,以此缓解一词多义和歧义问题造成的性能损失。
技术关键词
网络
高维特征向量
序列
实体
依存句法分析
文本编码器
预训练模型
工具包
语义
注意力机制
生成特征向量
词语
分词
线性
关系
系统为您推荐了相关专利信息
数据降维算法
定标模型
协方差矩阵
特征提取算法
光纤传感器
位置校正方法
环境试验箱
特征值
像素点
判断蒸发器