多模态联合注意力自动检测方法、装置及终端

AITNT
正文
推荐专利
多模态联合注意力自动检测方法、装置及终端
申请号:CN202510892628
申请日期:2025-06-30
公开号:CN120783390A
公开日期:2025-10-14
类型:发明专利
摘要
本申请提供一种多模态联合注意力自动检测方法、装置及终端。该方法包括:获取待检测的人物互动视频,并将所述人物互动视频拆分成多帧图像;对每帧图像进行预处理,获得每帧图像对应的头部图像以及注视热图;将每帧图像及其对应的头部图像和注视热图输入至预先训练好的多模态注视区域估计模型中,获得每帧图像对应的注视点热图以及注视分类结果;基于各帧图像分别对应的注视点热图,根据预先设定的联合注意力检测规则,对所述人物互动视频进行联合注意力检测,得到所述人物互动视频对应的联合注意力检测结果。本申请实现了联合注意力的自动识别,提高了联合注意力识别的准确性与稳定性。
技术关键词
自动检测方法 注意力 注视点 三维人体姿态 输出解码器 多模态 联合损失函数 视频 图像编码器 采样模块 融合特征 自动检测装置 电子终端 网络 存储器
系统为您推荐了相关专利信息
1
一种融合时间序列的图神经网络会话推荐方法
会话推荐方法 项目 多头注意力机制 异构 序列
2
服装属性识别方法、系统、计算机设备和可读存储介质
服装 属性识别方法 图片 属性识别模型 深度学习模型
3
一种基于Transformer的红外焦平面阵列漂移率计算参数估计方法
红外焦平面阵列 参数估计方法 编码器模块 前馈神经网络 遗传编程算法
4
一种基于机器学习的气候预测订正方法、系统、设备及介质
订正方法 智能网 序列 气候预测系统 模式
5
一种水工结构泄洪振动响应的超参数优化预测的方法
水工结构 卷积神经网络模块 双向长短期记忆网络 皮尔逊相关系数 超参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号