一种基于多模态的图像语义分割方法、装置、设备及介质

正文

推荐专利

申请号：CN202510520862

申请日期：2025-04-24

公开号：CN120374984A

公开日期：2025-07-25

类型：发明专利

摘要

本申请公开了一种基于多模态的图像语义分割方法、装置、设备及介质，涉及人工智能领域，包括：获取包括目标图像、标签文本信息和第一标签边框信息的目标数据集；获取目标语义分割请求，从目标图像中确定与其对应的待分割图像，为待分割图像生成第一正、负样本提示点和第二正、负样本提示点；基于第一正、负样本提示点确定第一目标灰度图像，基于第二正、负样本提示点确定第二目标灰度图像；基于目标图像和标签文本信息确定第二标签边框信息，基于第二标签边框信息确定第三目标灰度图像；基于第一标签边框信息确定第四目标灰度图像；根据四种不同的目标灰度图像确定最终的目标灰度图像，对目标灰度图像进行渲染以得到语义分割后的目标图像。

技术关键词

图像语义分割方法图像分割模型显著性检测技术样本标签文本对象检测模型多模态像素点图像语义分割装置核心颜色基准数据获取模块

系统为您推荐了相关专利信息

一种基于改进YOLOv5s模型的输电塔螺栓松动检测方法

螺栓松动检测方法输电塔松动螺栓模块训练集

一种视网膜母细胞瘤诊疗辅助方法、系统、设备及介质

视网膜母细胞瘤图像分割模型视盘数据肿瘤

一种基于深度强化学习的机械臂6D位姿抓取方法

深度强化学习抓取方法仿真环境样本末端夹持器

基于半监督零样本学习的高光谱-多光谱融合超分辨率重建方法

超分辨率重建方法多光谱上采样图像超分辨率预训练模型

基于深度迁移学习的多标签亚细胞定位预测方法

定位预测方法深度迁移学习样本迁移学习模型迁移学习方法

一种基于多模态的图像语义分割方法、装置、设备及介质

站点导航

APP 下载