摘要
本发明公开一种基于Transformer实现在大图切片推理后处理中NMS计算的方法,为能够实现NMS的过滤操作,本发明将深度学习网络检测到的目标框的坐标、类别以及置信度作为语义信息输入到transformer模型中,学习得到过滤之后的坐标等信息;其次为了提高模型推理速度,本发明将简化transformer的模型结构。因而真正意义上实现了目标检测网络端到端的推理,省去了模型在CPU上进行后处理的过程。
技术关键词
切片
坐标
注意力机制
深度学习网络
标签
滑动窗口
瘦身
数据
语义
编码
图像
速度
模块
系统为您推荐了相关专利信息
眼底血管分割方法
眼底彩照
双线性插值
注意力机制
上采样
情感特征
情感分析方法
稀疏特征
文本
情感分类器