摘要
本发明提供了一种基于自适应重构超图的多模态情感计算方法及系统,包括:基于目标对象的视频获取目标对象的文本、语音和视觉序列,提取文本特征、语音特征和视觉特征;文本特征、语音特征和视觉特征分别进行特征编码得到带有时序关系的文本、语音和视觉模态;将带有时序关系的文本、语音和视觉模态的所有时间序列点作为超图节点,并初始化不同时序点之间的连接关系,获取超图结构和超图结构点特征;针对超图结构和超图结构点特征,优化超图结构点特征,得到优化后的超图结构点特征;获取超图结构最后一层点特征,对最后一层点特征进行平均池化,将最后一层点特征聚合为最终的多模态情感向量表征;基于最终的多模态情感向量表征进行情感类别判断。
技术关键词
情感计算方法
语音特征
双向长短期记忆网络
文本
视觉特征
情感类别
时序
重构
序列
对象
模态特征
BERT模型
矩阵
视频
模块
多模态
关系
多层感知机
系统为您推荐了相关专利信息
强化学习算法
项目调度方法
定义
资源重分配
动态
生成对抗模型
噪声图像
样本
生成图像生成模型
随机噪声
融合特征
基站
多模态
系统调度方法
功率分配策略