摘要
本发明公开了一种涉及图像处理技术领域的基于多模态提示的目标检测方法、装置、电子设备和介质,所述方法包括:获取待检测图像,以及待检测目标的检测指令;所述检测指令包括所述待检测目标的第一图像特征和/或第一文字描述信息;将所述待检测图像和所述检测指令输入到预先训练好的目标检测大模型中进行目标检测,得到所述待检测图像中所述待检测目标的检测结果;其中,所述目标检测大模型是基于无标注的样本图像及其多模态数据和预设特征构建的伪标签,并采用无监督训练方式训练得到的。采用该方法能够解决目标检测预训练模型的能力、准确性和可靠性的限制,提高目标检测的准确性和可靠性。
技术关键词
样本
多模态
指令
无监督
标签
电子设备
预训练模型
图像处理技术
处理器
可读存储介质
存储器
解码器
数据
模块
计算机
坐标
系统为您推荐了相关专利信息
建筑检测方法
遥感图像数据
卷积模块
建筑物
注意力
线控转向系统
游戏模式控制方法
方向盘
游戏系统
刹车踏板信号
商标识别方法
融合特征
非易失性存储介质
特征金字塔网络
级联卷积神经网络
工控一体机
多模态数据融合
异常检测方法
网络特征
多模态网络
等位基因突变频率
位点
突变等位基因
非线性
样本