摘要
本申请提供一种目标检测方法、装置及设备,该方法包括:基于提示词文本确定目标实体,确定目标实体对应的等价实体和误报实体;从待检测图像中获取目标实体对应的第一检测框、等价实体对应的第二检测框、误报实体对应的第三检测框;基于第一检测框、第二检测框和第三检测框之间的重叠程度确定目标检测框;从待检测图像截取目标检测框的检测子图像,基于检测子图像确定目标属性信息,并输出所述目标属性信息和所述目标检测框。通过本申请的技术方案,能够有效剔除误报的检测框,提升语义一致性的建模能力。
技术关键词
实体
跨模态
样本
图像
文本
机器可读存储介质
对象
语义
处理器
动态
模块
周期
电子设备
指令
聚类
关系