基于文本驱动跨模态融合和互信息估计的多模态情感分析模型构建方法

AITNT
正文
推荐专利
基于文本驱动跨模态融合和互信息估计的多模态情感分析模型构建方法
申请号:CN202411434542
申请日期:2024-10-15
公开号:CN119293730B
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种基于文本驱动跨模态融合和互信息估计的多模态情感分析模型构建方法,包括:提取待分析视频的文本特征、音频特征和视频特征,构建具有上下文时序信息的特征提取模块;基于跨模态注意力机制使其他模态特征能够感知文本情感信息,构建堆叠文本驱动跨模态融合模块;为尽可能保留任务相关信息并滤除与任务无关的噪声信息,构建对融合特征向量进行互信息上下界估计的互信息估计模块;结合互信息估计模块与主任务损失函数构建损失函数模块;构建将融合特征向量输入到激活函数进行情感极性判断的预测模块。本发明构建的多模态情感分析模型在两个公开可用的数据集进行了全面实验,实验结果表明该模型的情感分析性能有显著提升。
技术关键词
跨模态 文本 注意力方法 模态特征 视频 多模态 特征提取模块 噪声信息 音频特征 子模块 注意力机制 情感分析模型 样本 线索 表达式 参数 时序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号