摘要
发明公开了基于多层感知机融合的视频多模态情感分析方法及装置,涉及情感分析技术领域,方法包括:S1,提取视频中的文本特征、图像特征和音频特征;进行图像特征和音频特征中的时序信息提取得到时序图像特征和时序音频特征;S2,构建包括多模态特征捕捉模块、多层感知机融合模块和情感分类器的视频多模态情感分析模型,以模态间的模态相似性、模态异质性构建损失函数;S3,对模型进行训练;S4,将文本特征、时序图像特征和时序音频特征输入训练好的模型,得到情感极性概率分布。本发明通过构建相似性损失与异质性损失,使用多层感知机进行序列、通道和模态维度融合,降低了计算复杂度与内存消耗,提升了多模态情感特征的完整性与判别性能力。
技术关键词
多层感知机
音频特征
情感特征
时序
情感分类器
视频
文本
多模态特征
图像
融合特征
特征提取模型
序列
情感分析模型训练
前馈神经网络
通道
多模态情感分析
系统为您推荐了相关专利信息
动态神经网络模型
智慧养老
老年人
分析方法
特征提取算法
时序约束文件
功能模块
生成方法
报告
EDA工具
物流配送服务
语音
声学特征
序列
双向长短期记忆网络
时隙业务
神经网络模型
数据传输需求
离散小波变换
压力
运动传感器数据
身份认证方法
隐式身份认证
时序特征
一维卷积神经网络