摘要
本申请公开了多模态实体识别方法、装置、终端设备及介质,包括:获取输入数据,其中,输入数据至少包括文本数据和图像数据;根据输入数据和预先训练好的识别模型,确定与输入数据对应的实体信息,其中,预先训练好的识别模型是对多模态样本数据进行文本特征和图像特征的提取,并对文本特征和图像特征进行融合,得到融合特征,采用融合特征对基于跨模态注意机制的训练模型进行训练得到的,本申请实施例通过增加一个多模态特征融合编码模块,该模块利用三种视觉特征来表示图像语义的各个方面。最后,通过协作表示整合这些特征,并使用共享的多任务标签解码器来联合解码文本和多模态表示,以进行实体预测,提高了多模态实体预测的准确性。
技术关键词
实体识别方法
融合特征
多模态
图像视觉特征向量
图像特征向量
数据
跨模态
BERT模型
样本
语义
文本特征向量
标签
多任务
编码向量
终端设备
机制
系统为您推荐了相关专利信息
自动化检测方法
牙齿疾病
标签
学生
多尺度特征金字塔
在线识别方法
遥感图像识别
分布式文件存储系统
遥感图像分类
集群
液压支架
基准轮廓
采煤设备
多模态数据采集
控制系统
信息登记方法
身份验证
门岗设备
人脸图像数据
多模态