摘要
本发明公开了一种基于BERT、ViT和宽度学习的图文多模态情绪原因对识别方法,属于情绪原因对识别技术领域。本发明对文本和图文数据分别通过预训练模型BERT和ViT进行向量化表示,采用Transformer编码器对文本特征和图像特征进行融合,生成多模态特征表示,使用图注意力网络建模文本子句关系,将经图注意力网络处理后的图文融合特征进行宽度学习横向特征扩展,并与图注意力网络处理后的图文融合特征进行拼接,利用宽度学习扩展后的图文融合特征进行情绪原因对识别。本发明能有效地获取经宽度学习特征增强的图文融合特征,有效提高了文本评论情绪原因对识别结果,本发明的精确率,召回率以及F1值均优于现有模型。
技术关键词
多模态情绪
文本
识别方法
编码器
融合特征
预训练模型
横向特征
验证分类器
生成图文
网络
多模态特征
序列
节点
图像全局特征
注意力机制
数据
系统为您推荐了相关专利信息
人机交互数据
早期预警方法
Softmax分类器
学生
教师
多步预测方法
记忆单元
集合经验模态分解
堆叠模块
门控神经网络
多模态
云端
融合特征
滑动窗口机制
特征提取网络
健康度评估方法
高斯混合模型
半监督聚类
多维时序数据
样本