摘要
本发明公开了一种基于动态路由混合专家模型的多模态图文情感识别方法及系统,用于现有的多模态图文情感识别方法通常采用静态融合机制,导致模型识别效果不佳的技术问题。方法包括获取图像数据和文本数据,将图像数据和文本数据输入至预置多模态图文情感识别网络,预置多模态图文情感识别网络包括目标编码器、动态路由混合专家模型、情感分类器;通过目标编码器对图像数据和文本数据进行编码,输出图像全局特征和文本全局特征;对图像全局特征和文本全局特征进行多模态特征融合,生成图像文本融合特征;采用动态路由混合专家模型对图像文本融合特征进行动态专家计算,输出加权特征;将加权特征输入至情感分类器,生成目标多模态图文情感识别结果。
技术关键词
图像全局特征
情感识别方法
情感分类器
图文
加权特征
融合特征
多模态特征融合
图像嵌入
动态
训练文本数据
文本编码器
图像编码器
训练图像数据
降维特征
变换特征
系统为您推荐了相关专利信息
缺陷识别方法
输变电工程
图像特征向量
生成设计图
文本
智能车灯
辅助驾驶系统
注意力机制
车辆高位刹车灯
智能辅助驾驶
数字病理图像
乳腺癌分子分型
组织病理图像
图像块
加权特征
水下光学图像
双向特征金字塔
注意力机制
双曲正切函数
sigmoid函数
语义向量
作业批改方法
图像编码
图文
特征向量库