摘要
本发明公开了一种基于Mamba架构的人物交互检测方法,包括:1.全局特征编码:将待检测图像输入全局特征编码器进行特征提取,获得用于全局视觉表示;2.多视角特征聚合:将全局视觉表示和一组查询输入两个级联的CEM单元,获得浅层共享语义和深层共享语义,同时实现人体分支和物体分支的信息交换;3.人体分支和物体分支:通过四阶段的特征提取策略来分别获得低、中、高和综合的检测特征,获取丰富的检测信息;4.交互分支:构建一种多阶段、自适应动态加权的全面渐进学习策略来获得高级的视觉理解,提升模型在罕见和复杂交互类别上的识别性能。本发明能充分提取丰富全面的交互语义,用于驱动检测交互的人‑物体对,从而帮助发现更多的人物交互检测实例。
技术关键词
交互检测方法
分支
物体
多视角特征
阶段
交互特征
全局视觉特征
强化人体
矩阵
语义
编码模块
图像
动态
编码器
超参数
可读存储介质
系统为您推荐了相关专利信息
渐进损伤模型
胶结充填体
应力
试件
裂纹扩展长度
储能设备
充放电工作
充放电控制方法
电池组
控制芯片
遥感图像压缩方法
高光谱遥感图像
混合模块
上采样
高斯混合模型