摘要
一种基于依存句法和图神经网络的多模态命名实体识别方法,包括以下步骤:获取文本及文本关联图像,利用预训练模型获取文本的上下文特征表示并分别构建文本语义图和文本句法图,然后利用图共享卷积网络对文本的上下文特征表示、文本语义图和文本句法图进行处理,获取最终文本特征表示;通过图像字幕生成模型将文本关联图像转换为图像标题,构建图像标题语义图和图像标题句法图,然后利用图共享卷积网络,获取最终图像标题特征表示;利用视觉图神经网络对文本关联图像进行提取,获取图级视觉特征表示;利用跨模态Transformer融合获得多模态特征表示,然后利用条件随机场对多模态特征表示进行处理,输出实体概率分布。本发明通过充分挖掘和利用语义信息和句法信息,显著提升了命名实体准确性,提高多模态命名实体识别的有效性和灵活性。
技术关键词
命名实体识别方法
文本
依存句法
预训练模型
上下文特征
卷积神经网络模型
图像
条件随机场
视觉特征
语义
节点
跨模态
输出特征
多模态特征
高维特征向量
多头注意力机制
矩阵
邻居