摘要
本申请公开了一种数据处理方法、计算机、存储介质及程序产品,方法包括:根据上下文词语的原始语义嵌入向量,以及所述每个词语的义原语义嵌入向量,确定所述每个词语的增强语义嵌入向量;根据所述上下文词语的义原语义嵌入向量,以及所述每个词语的原始语义嵌入向量,确定所述上下文词语的增强语义嵌入向量;根据所述每个词语的原始语义嵌入向量、增强语义嵌入向量、所述上下文词语的增强语义嵌入向量以及所述每个词语在所述语句中的位置编码,得到所述每个词语的语义嵌入向量。通过融合词语的多义义项嵌入向量、上下文语义关联及位置信息,有效解决现有远程监督关系抽取中未充分考虑句子中单词的多重含义的问题,从而提高关系抽取的准确性。
技术关键词
词语
数据处理方法
可执行程序代码
语句
融合语义
计算机程序产品
注意力
编码
可读存储介质
处理器
图谱
存储器
指令
关系