摘要
本申请公开了一种基于多模态的图像语义分割方法、装置、设备及介质,涉及人工智能领域,包括:获取包括目标图像、标签文本信息和第一标签边框信息的目标数据集;获取目标语义分割请求,从目标图像中确定与其对应的待分割图像,为待分割图像生成第一正、负样本提示点和第二正、负样本提示点;基于第一正、负样本提示点确定第一目标灰度图像,基于第二正、负样本提示点确定第二目标灰度图像;基于目标图像和标签文本信息确定第二标签边框信息,基于第二标签边框信息确定第三目标灰度图像;基于第一标签边框信息确定第四目标灰度图像;根据四种不同的目标灰度图像确定最终的目标灰度图像,对目标灰度图像进行渲染以得到语义分割后的目标图像。
技术关键词
图像语义分割方法
图像分割模型
显著性检测技术
样本
标签文本
对象检测模型
多模态
像素点
图像语义分割装置
核心
颜色
基准
数据获取模块
系统为您推荐了相关专利信息
深度强化学习
抓取方法
仿真环境
样本
末端夹持器
超分辨率重建方法
多光谱
上采样
图像超分辨率
预训练模型
定位预测方法
深度迁移学习
样本
迁移学习模型
迁移学习方法