摘要
本申请涉及计算机视觉技术领域,特别涉及一种基于文本驱动的弱监督小样本部件分割方法及装置,其中,方法包括:提取图像特征并生成部件的文本原型;利用伪掩码生成模块计算像素级相似度,并为每个像素分配对应的部件类别标签,生成伪标签,从图像特征中提取视觉部件原型;基于文本原型和伪标签,将文本原型中的语义信息嵌入到图像的空间特征中,以利用双模态原型一致性学习模块,在视觉和文本模态之间保持部件原型的一致性;通过预设双模态协同分割策略,生成部件分割结果。由此,解决了相关技术的分割方法由于文本和图像信息的对齐程度较低且部件原型学习的局限性,致使文本信息难以被模型有效利用且无法保证图像与文本之间的语义一致性的问题。
技术关键词
原型
部件分割方法
双模态
像素
标签
文本编码器
图像编码器
模块
样本
计算机视觉技术
策略
跨模态
语义
分割装置
计算机程序产品
机制
处理器
系统为您推荐了相关专利信息
信号识别方法
信号识别模型
切片
嵌入位置编码
多头注意力机制
投影图像数据
原始图像数据
激光扫描仪
连续性
内存
大语言模型
文本
计算机可执行指令
指定图像格式
检索设备