基于文本驱动的弱监督小样本部件分割方法及装置

正文

推荐专利

申请号：CN202510872124

申请日期：2025-06-26

公开号：CN120997494A

公开日期：2025-11-21

类型：发明专利

摘要

本申请涉及计算机视觉技术领域，特别涉及一种基于文本驱动的弱监督小样本部件分割方法及装置，其中，方法包括：提取图像特征并生成部件的文本原型；利用伪掩码生成模块计算像素级相似度，并为每个像素分配对应的部件类别标签，生成伪标签，从图像特征中提取视觉部件原型；基于文本原型和伪标签，将文本原型中的语义信息嵌入到图像的空间特征中，以利用双模态原型一致性学习模块，在视觉和文本模态之间保持部件原型的一致性；通过预设双模态协同分割策略，生成部件分割结果。由此，解决了相关技术的分割方法由于文本和图像信息的对齐程度较低且部件原型学习的局限性，致使文本信息难以被模型有效利用且无法保证图像与文本之间的语义一致性的问题。

技术关键词

原型部件分割方法双模态像素标签文本编码器图像编码器模块样本计算机视觉技术策略跨模态语义分割装置计算机程序产品机制处理器

系统为您推荐了相关专利信息

一种基于机器学习的泥石流地震动信号识别方法

信号识别方法信号识别模型切片嵌入位置编码多头注意力机制

环卫垃圾的分类处理方法及相关设备

标签磁力分离器传送带非金属垃圾颜色校正

一种投影区域非平面调整方法、介质及系统

投影图像数据原始图像数据激光扫描仪连续性内存

一种基于大语言模型的图像跨模态检索方法、设备及介质

大语言模型文本计算机可执行指令指定图像格式检索设备

一种家禽健康状况检测方法、系统、设备及存储介质

健康状况检测方法家禽音频数据编码结构

基于文本驱动的弱监督小样本部件分割方法及装置

站点导航

APP 下载