一种基于跨模态语义对齐和交互学习的多模态情感理解方法

正文

推荐专利

申请号：CN202411474129

申请日期：2024-10-22

公开号：CN119475214B

公开日期：2025-12-16

类型：发明专利

摘要

本发明公开了一种基于跨模态语义对齐和交互学习的多模态情感理解方法，方法包括：获取多模态的初始数据；对各模态的初始数据进行语义量化处理；根据语义特征集合，进行文本模态主导的跨模态特征聚合学习；根据多模态语义聚合特征表达，进行多模态特征的模态内语义关系学习，确定模态内语义Tokens之间的上下文关系，并通过与文本模态进行语义对齐，增强不同模态特征表达的语义一致性；采用多模态融合策略，将多模态的特征进行融合处理，得到融合特征；根据融合特征建立情感理解模型，并根据情感理解模型实现多模态情感理解处理。本发明实施例能够提升情感分析的性能，利于促进不同模态的有效融合，可广泛应用于计算机技术领域。

技术关键词

跨模态融合特征语义特征文本多模态特征融合策略 BERT模型序列特征注意力机制生成视频序列网络结构音频特征视觉特征编码器关系聚类理解系统

系统为您推荐了相关专利信息

基于遥感图像的水生植被分类方法、装置及存储介质

植被分类方法深度卷积神经网络编码器模块全局平均池化空洞

网页元素定位的方法、装置、设备、存储介质及程序产品

节点树形结构网页元素文本语义

一种基于多模态情感识别和定制化人像生成的机器人拟人化交互方法

视频内容特征拟人化交互方法多模态情感识别个性化头像面部

基于双权值监督的红外与可见光图像融合系统

可见光图像融合系统生成融合图像多尺度特征融合注意力

一种基于概要词的稠密稀疏检索融合方法和装置

关键词融合方法文库序列指令

一种基于跨模态语义对齐和交互学习的多模态情感理解方法

站点导航

APP 下载