摘要
本发明所提供的一种无需提示的物体检测方法、装置、终端及存储介质,方法包括将待检测图像输入已训练的通用视觉提示模型,得到若干第一检测框;对各个所述第一检测框进行类别名称预测,得到各个所述第一检测框的第一类别;获取所述待检测图像的图像特征,将所述第一类别作为文本提示,对所述图像特征进行目标检测,得到第二检测框和对应的第二类别;基于所述第一检测框和所述第二检测框确定最终检测框、所述最终检测框对应的类别名称。本发明无需任何先验信息输入,先获得初始分类,再将初始分类作为文本提示检测模型的文本提示进行目标检测,提高了检测结果的准确性,实现无需任何提示即可输出图像中所有对象的最终检测框及其类别名称。
技术关键词
物体检测方法
视觉
图像
物体检测程序
多任务损失函数
类别预测模型
预测类别
物体检测装置
文本
可读存储介质
多尺度特征
解码器
编码器
处理器
输入模块
对象
终端
输出模块
存储器