摘要
本发明公开了基于实例空间关联的人物交互检测方法,包括:数据收集;构建实例内与实例间人物交互检测网络模型,包括特征提取部分、Transformer结构部分,所述Transformer结构部分:包括编码器、实例解码器、交互解码器,所述实例解码器为多层结构,每层包括一个多头自注意力模块、一个多尺度可变注意力模块、一个前馈神经网络、边界框回归;该实例解码器能解码多尺度编码特征,生成人和物的检测结果,并用于交互识别;将图像输入训练好的实例内与实例间人物交互检测网络模型,输出人和物的边界框、物的类别与交互类别,进行人物交互关系检测。本发明具有模型泛化性好,实例检测和交互分类准确性高的特点。
技术关键词
交互检测方法
解码器
检测网络模型
前馈神经网络
注意力
空间关系特征
交互特征
编码特征
多层结构
输入多尺度
编码器
模块
空间布局特征
动作特征
图谱
物体
生成多尺度
查询特征
系统为您推荐了相关专利信息
深度神经网络模型
数据异常检测方法
编码器参数
数据异常检测系统
异常数据
电力数据清洗
辅助编码器
电力运行数据
主编码器
电力系统数据处理技术
浓度预测方法
光照特征
LSTM模型
模糊系统
LSTM算法