摘要
一种基于SAM候选框生成与候选区域‑词聚类的开放词汇物体检测方法,属于机器视觉中的物体检测技术领域。本发明针对现有开放词汇物体检测技术存在新颖类别的候选框不足以及二分匹配导致匹配缺失的问题。包括获取输入图像基于SAM模块的候选框和感兴趣区域候选框并进行拼接,再经特征对齐层得到候选框映射特征;获得输入图像的标签的编码特征,并与候选框映射特征进行二分匹配;采用候选区域‑词聚类模块将每一对二分匹配结果对应的编码特征和候选框映射特征相加,得到配置标签的候选框映射特征;计算其余候选框映射特征与配置标签的候选框映射特征的余弦相似度,并为其余候选框映射特征匹配标签类别,实现一对多匹配。本发明用于开放词汇物体检测。
技术关键词
物体检测方法
SAM模块
图像编码器
配置标签
编码特征
物体检测技术
文本编码器
标签类别
区域候选网络
感兴趣
模型预训练
比例可调
网格
自然语言
关键词
渠道
系统为您推荐了相关专利信息
医学图像分类方法
注意力模型
图像编码器
视觉特征
文本编码器
图像处理模型
图像特征信息
融合特征
计算机辅助诊断方法
样本
信号解码方法
视觉诱发脑
语义特征
多模态
重建高分辨率图像
视频动作识别方法
文本编码器
图像编码器
视频动作分类
多模态