摘要
本发明公开了一种基于跨模态语义对齐和交互学习的多模态情感理解方法,方法包括:获取多模态的初始数据;对各模态的初始数据进行语义量化处理;根据语义特征集合,进行文本模态主导的跨模态特征聚合学习;根据多模态语义聚合特征表达,进行多模态特征的模态内语义关系学习,确定模态内语义Tokens之间的上下文关系,并通过与文本模态进行语义对齐,增强不同模态特征表达的语义一致性;采用多模态融合策略,将多模态的特征进行融合处理,得到融合特征;根据融合特征建立情感理解模型,并根据情感理解模型实现多模态情感理解处理。本发明实施例能够提升情感分析的性能,利于促进不同模态的有效融合,可广泛应用于计算机技术领域。
技术关键词
跨模态
融合特征
语义特征
文本
多模态特征
融合策略
BERT模型
序列特征
注意力机制
生成视频序列
网络结构
音频特征
视觉特征
编码器
关系
聚类
理解系统
系统为您推荐了相关专利信息
植被分类方法
深度卷积神经网络
编码器模块
全局平均池化
空洞
视频内容特征
拟人化交互方法
多模态情感识别
个性化头像
面部
可见光图像
融合系统
生成融合图像
多尺度特征融合
注意力