基于SAM候选框生成与候选区域-词聚类的开放词汇物体检测方法

正文

推荐专利

申请号：CN202510634031

申请日期：2025-05-16

公开号：CN120451679A

公开日期：2025-08-08

类型：发明专利

摘要

一种基于SAM候选框生成与候选区域‑词聚类的开放词汇物体检测方法，属于机器视觉中的物体检测技术领域。本发明针对现有开放词汇物体检测技术存在新颖类别的候选框不足以及二分匹配导致匹配缺失的问题。包括获取输入图像基于SAM模块的候选框和感兴趣区域候选框并进行拼接，再经特征对齐层得到候选框映射特征；获得输入图像的标签的编码特征，并与候选框映射特征进行二分匹配；采用候选区域‑词聚类模块将每一对二分匹配结果对应的编码特征和候选框映射特征相加，得到配置标签的候选框映射特征；计算其余候选框映射特征与配置标签的候选框映射特征的余弦相似度，并为其余候选框映射特征匹配标签类别，实现一对多匹配。本发明用于开放词汇物体检测。

技术关键词

物体检测方法 SAM模块图像编码器配置标签编码特征物体检测技术文本编码器标签类别区域候选网络感兴趣模型预训练比例可调网格自然语言关键词渠道

系统为您推荐了相关专利信息

一种基于提示反向学习的医学图像分类方法、装置及介质

医学图像分类方法注意力模型图像编码器视觉特征文本编码器

图像处理方法、癌症的计算机辅助诊断方法

图像处理模型图像特征信息融合特征计算机辅助诊断方法样本

一种用于公共卫生科普的视觉信息推送方法及系统

编码特征画像信息推送方法编码向量语义

基于多模态扩散模型的视觉诱发脑信号解码方法及系统

信号解码方法视觉诱发脑语义特征多模态重建高分辨率图像

基于多模态提示学习的零样本视频动作识别方法

视频动作识别方法文本编码器图像编码器视频动作分类多模态

基于SAM候选框生成与候选区域-词聚类的开放词汇物体检测方法

站点导航

APP 下载