多模态联合注意力自动检测方法、装置及终端

正文

推荐专利

申请号：CN202510892628

申请日期：2025-06-30

公开号：CN120783390A

公开日期：2025-10-14

类型：发明专利

摘要

本申请提供一种多模态联合注意力自动检测方法、装置及终端。该方法包括：获取待检测的人物互动视频，并将所述人物互动视频拆分成多帧图像；对每帧图像进行预处理，获得每帧图像对应的头部图像以及注视热图；将每帧图像及其对应的头部图像和注视热图输入至预先训练好的多模态注视区域估计模型中，获得每帧图像对应的注视点热图以及注视分类结果；基于各帧图像分别对应的注视点热图，根据预先设定的联合注意力检测规则，对所述人物互动视频进行联合注意力检测，得到所述人物互动视频对应的联合注意力检测结果。本申请实现了联合注意力的自动识别，提高了联合注意力识别的准确性与稳定性。

技术关键词

自动检测方法注意力注视点三维人体姿态输出解码器多模态联合损失函数视频图像编码器采样模块融合特征自动检测装置电子终端网络存储器

系统为您推荐了相关专利信息

一种融合时间序列的图神经网络会话推荐方法

会话推荐方法项目多头注意力机制异构序列

服装属性识别方法、系统、计算机设备和可读存储介质

服装属性识别方法图片属性识别模型深度学习模型

一种基于Transformer的红外焦平面阵列漂移率计算参数估计方法

红外焦平面阵列参数估计方法编码器模块前馈神经网络遗传编程算法

一种基于机器学习的气候预测订正方法、系统、设备及介质

订正方法智能网序列气候预测系统模式

一种水工结构泄洪振动响应的超参数优化预测的方法

水工结构卷积神经网络模块双向长短期记忆网络皮尔逊相关系数超参数

多模态联合注意力自动检测方法、装置及终端

站点导航

APP 下载