摘要
本公开涉及一种针对Transformer架构人‑物交互检测模型的分类器重新校准方法,用于解决当前的HOI检测数据集存在的长尾分布所导致的深度学习分类器的错误预测问题。本案提取训练集中的所有待识别图像的人‑物交互实例特征为正负特征,并进一步从负特征中分出难负特征;将人‑物交互分类器在每个类别上的权重作为类别原型,利用原型有监督对比学习的形式,对每个类别计算损失函数,并按类别独立地进行反向传播,以对类别原型进行针对性优化校准。本案创新性地使用原型有监督对比学习,重新校准人‑物交互检测分类器,挖掘现有模型的错误预测,针对性地对其进行校准,提升了人‑物交互检测的准确性,尤其对于样本数量极少的尾部动作类别。
技术关键词
编码解码器
原型
标签类别
校准方法
模型训练模块
学习分类器
图像
网络
校准系统
样本
物体
图片
人体
参数
可读存储介质
动态
系统为您推荐了相关专利信息
物理化学特征
特征信息处理
信息处理模块
序列
交叉验证方法
城市轨道交通隧道
态势预测方法
监测点
数值
地铁车站出入口
分类方法
掩码矩阵
序列
描述符
Sigmoid函数
多光谱传感器
自动化校准系统
校准误差
传感器响应
特征点