一种基于多模态模型的交互式图像标注方法及系统

正文

推荐专利

申请号：CN202411952617

申请日期：2024-12-27

公开号：CN119963881B

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种基于多模态模型的交互式图像标注方法及系统，包括：构建目标检测模型；获取待检测图像和提示词文本，对提示词文本进行分词，得到的若干词元作为不同的待检测目标类别，对于每个待检测目标类别，提取负向提示词中存在的相应负向类别，生成词元索引表；设置置信度阈值，将待检测图像、提示词文本和词元索引表输入所述目标检测模型，目标检测模型生成中间检测；设置类间非极大值抑制的IoU阈值，结合负向提示词对中间检测进行过滤，生成最终检测结果。本发明可以在不对特定类别进行训练的前提下，获得准确的检测结果，并且能够通过负向提示词和描述提示词交互式地减少误检，自动为图像生成准确的标注。

技术关键词

交互式图像标注多模态文本置信度阈值索引表深度神经网络图像标注系统样本跨模态分词预测类别数据模块多尺度因子坐标参数解码

系统为您推荐了相关专利信息

一种基于大数据的烧伤病房感染防控智能预警系统

智能预警系统烧伤病房环境监测数据长短期记忆网络大数据

一种基于边界信息的光声多模态分割方法、系统及介质

图像分割网络文本编码器图像编码器分割方法计算机可读储存介质

图像搜索方法、装置、电子设备及存储介质

图像搜索方法融合语义图像搜索装置数据动态

基于足踝恢复监控的助眠联动系统

恢复监控联动系统睡眠监测设备助眠设备分析模块

光散射及影像识别双重法超纯水颗粒监测系统及方法

颗粒监测系统动态反馈控制层流稳定装置超纯水多模态数据融合

一种基于多模态模型的交互式图像标注方法及系统

站点导航

APP 下载