摘要
本发明公开了一种多模态实体关系联合抽取方法,先下载原始图像及原始图像对应的文本描述,然后提取文本描述与原始图像的特征;接着,计算图像特征在文本特征上的投影分量,并选出每个像素点的最大投影值进行归一化;然后根据归一化结果对对图像特征进行加权处理,并将加权处理的结果与文本特征进行跨模态特征融合,最后根据融合结果提取实体关系三元组。
技术关键词
注意力机制
跨模态
三元组
实体
标签
Sigmoid函数
矩阵
社交媒体平台
多模态
文本特征向量
BERT模型
像素点
前馈神经网络
关系
图像特征提取
元素
非线性
系统为您推荐了相关专利信息
胶囊内窥镜
三维卷积神经网络模型
多层感知机层
编码器模块
多头注意力机制