摘要
本发明公开了一种基于细粒度分层语义融合的注意力状态分析方法、系统、装置及存储介质,方法包括获取目标对象的多模态图像数据;将多模态图像数据输入预先训练好的特征提取映射模型,经过分层提取得到各模态的细粒度语义特征;其中,特征提取映射模型包括表情细粒度特征提取模块、头部姿态细粒度特征提取模块和眨眼细粒度特征提取模块;将各模态的细粒度语义特征输入预先训练好的特征融合模型进行多模态特征融合,得到最终融合特征;基于最终融合特征,通过预先构建好的注意力状态预测模型得到目标对象的注意力状态分析结果。本发明通过融合多模态细粒度特征显著提高了对注意力状态分析的准确性和可靠性。
技术关键词
注意力
状态分析方法
特征提取模块
语义特征
融合特征
多模态特征融合
面部动作单元
动态变化特征
分层
多模态图像数据
细粒度特征
上下文特征
线性变换矩阵
前馈神经网络
信息编码
对象
状态分析装置
系统为您推荐了相关专利信息
平衡独轮车
反作用飞轮
强化学习策略
多模态
驱动轮电机
无人机红外图像
预训练模型
图像增强
无人机检测方法
编码器训练
动态故障
矩阵
多任务损失函数
交互特征
诊断方法
水下侧扫声纳
特征提取网络
特征融合网络
深度学习网络模型
成像设备