一种基于VAFNet的多模态情绪识别方法及系统

AITNT
正文
推荐专利
一种基于VAFNet的多模态情绪识别方法及系统
申请号:CN202510177949
申请日期:2025-02-18
公开号:CN120260145A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了基于VAFNet的多模态情绪识别方法及系统,方法如下:S1.对视频数据集进行预处理、采样,转化为峰值帧序列;S2.将视频中的音频信号提取为一维时序信号并预处理,得到音频的Mel声谱图;S3.将视频峰值帧序列输入ResNet18模型提取空间特征得到面部空间特征,通过一维卷积整合时间信息,得到视频特征向量;将步骤S2得到的Mel声谱图、处理后的音频信号分别输入OCANet模型和WaveNet,提取谱特征和原始波形特征,得到Mel特征向量和波形特征向量;S4.对提取Mel特征向量、波形特征向量与面部空间特征输入基于交互注意力机制的特征融合模型得到交互特征向量,将Mel特征向量、视频特征向量及交互特征向量进行拼接融合得到多模态特征向量,进行情绪分类,输出情绪分类结果。
技术关键词
情绪识别方法 视频特征向量 声谱 交互注意力 波形 面部关键点 奇异值分解方法 情绪识别系统 序列 矩阵 信号 多模态 音频特征提取 短时傅里叶变换 筛选算法
系统为您推荐了相关专利信息
1
一种基于时间干涉的增强型无创脑深部电刺激系统和方法
电刺激系统 恒流源模块 调制电场 仿真子系统 微控制器
2
基于神经网络的非线性光脉冲整形参数优化方法及装置
参数优化方法 色散光纤 反演模型 可调衰减器 激光器
3
基于光通信的信号发射控制方法、装置及信号发射激光器
信号发射控制方法 双稳态 支持向量回归模型 时序特征 全光开关
4
一种基于微波光子的脉冲幅度调制通感一体化系统及方法
脉冲幅度调制信号 一体化方法 光电探测器 掺铒光纤放大器 一体化系统
5
一种基于双视角CNN-Transformer和外部注意力机制的心电信号分类方法
电信号 空间特征提取 注意力机制 视角 特征提取模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号