摘要
本发明涉及人工智能技术领域,具体公开了一种视频评论情感识别方法、电子设备及存储介质,由于对多个尺度的视频特征和文本特征提取共识特征,在解决视频文本模态不对齐的问题的同时,提升模型对不同时间粒度的视频特征的理解能力,根据多个尺度的共识特征进行注意力计算,得到第一融合特征,从而融合多种时间粒度上视频信息到文本中,提升视频相关的评论文本语义表达能力,基于第一融合特征进行分类计算,得到第一评论情感识别结果,可以解决不同评论对视频的关注位置、关注角度等不同所带来的视频文本语义不对齐的问题,提高视频评论情感识别的准确性。
技术关键词
情感识别方法
注意力
跨模态
文本
时间定位
融合特征
长短期记忆网络
电子设备
可读存储介质
存储计算机程序
人工智能技术
时序
键值
语义
视频帧
处理器
存储器
系统为您推荐了相关专利信息
多模态数据融合
梯度提升决策树
图谱
长短期记忆网络
电子设备
相位调制器
实时补偿方法
注意力模型
子模块
时间序列信息
照明特征
机器学习模型
计算机程序产品
照明机构
数据处理装置