基于文本驱动的弱监督小样本部件分割方法及装置

AITNT
正文
推荐专利
基于文本驱动的弱监督小样本部件分割方法及装置
申请号:CN202510872124
申请日期:2025-06-26
公开号:CN120997494A
公开日期:2025-11-21
类型:发明专利
摘要
本申请涉及计算机视觉技术领域,特别涉及一种基于文本驱动的弱监督小样本部件分割方法及装置,其中,方法包括:提取图像特征并生成部件的文本原型;利用伪掩码生成模块计算像素级相似度,并为每个像素分配对应的部件类别标签,生成伪标签,从图像特征中提取视觉部件原型;基于文本原型和伪标签,将文本原型中的语义信息嵌入到图像的空间特征中,以利用双模态原型一致性学习模块,在视觉和文本模态之间保持部件原型的一致性;通过预设双模态协同分割策略,生成部件分割结果。由此,解决了相关技术的分割方法由于文本和图像信息的对齐程度较低且部件原型学习的局限性,致使文本信息难以被模型有效利用且无法保证图像与文本之间的语义一致性的问题。
技术关键词
原型 部件分割方法 双模态 像素 标签 文本编码器 图像编码器 模块 样本 计算机视觉技术 策略 跨模态 语义 分割装置 计算机程序产品 机制 处理器
系统为您推荐了相关专利信息
1
一种基于机器学习的泥石流地震动信号识别方法
信号识别方法 信号识别模型 切片 嵌入位置编码 多头注意力机制
2
环卫垃圾的分类处理方法及相关设备
标签 磁力分离器 传送带 非金属垃圾 颜色校正
3
一种投影区域非平面调整方法、介质及系统
投影图像数据 原始图像数据 激光扫描仪 连续性 内存
4
一种基于大语言模型的图像跨模态检索方法、设备及介质
大语言模型 文本 计算机可执行指令 指定图像格式 检索设备
5
一种家禽健康状况检测方法、系统、设备及存储介质
健康状况检测方法 家禽 音频 数据 编码结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号