基于多层感知机融合的视频多模态情感分析方法及装置

正文

推荐专利

申请号：CN202511124491

申请日期：2025-08-12

公开号：CN120689802B

公开日期：2025-11-07

类型：发明专利

摘要

发明公开了基于多层感知机融合的视频多模态情感分析方法及装置，涉及情感分析技术领域，方法包括：S1，提取视频中的文本特征、图像特征和音频特征；进行图像特征和音频特征中的时序信息提取得到时序图像特征和时序音频特征；S2，构建包括多模态特征捕捉模块、多层感知机融合模块和情感分类器的视频多模态情感分析模型，以模态间的模态相似性、模态异质性构建损失函数；S3，对模型进行训练；S4，将文本特征、时序图像特征和时序音频特征输入训练好的模型，得到情感极性概率分布。本发明通过构建相似性损失与异质性损失，使用多层感知机进行序列、通道和模态维度融合，降低了计算复杂度与内存消耗，提升了多模态情感特征的完整性与判别性能力。

技术关键词

多层感知机音频特征情感特征时序情感分类器视频文本多模态特征图像融合特征特征提取模型序列情感分析模型训练前馈神经网络通道多模态情感分析

系统为您推荐了相关专利信息

一种用于智慧养老的老年人起居行为分析方法

动态神经网络模型智慧养老老年人分析方法特征提取算法

时序需求报告的生成方法、电子设备以及存储介质

时序约束文件功能模块生成方法报告 EDA工具

基于语音识别的物流配送服务评价方法以及装置

物流配送服务语音声学特征序列双向长短期记忆网络

一种跨域端到端的数据传输压力认知方法及装置

时隙业务神经网络模型数据传输需求离散小波变换压力

一种基于多运动传感器数据的隐式身份认证方法及相关装置

运动传感器数据身份认证方法隐式身份认证时序特征一维卷积神经网络

基于多层感知机融合的视频多模态情感分析方法及装置

站点导航

APP 下载