摘要
本发明属于人工智能、深度学习、计算机视觉和图像分割内容技术领域,公开了一种跨模态弱监督的图像分割方法。本发明首先使用分类损失函数确定前景目标的大致区域,然后使用矫正损失函数对目标区域进行矫正。矫正方法可以扩大相关的前景区域,将更多的前景区域纳入考虑,并降低背景区域的噪声影响。为了减少文本和图像特征之间的差异,本发明还提出了一个双边提词注意模块来更新两个分支的特征,通过直接将两个分支的特征相乘来获得对应的伪标签。此外,针对具有多个文本描述的相同目标区域,本发明还提出了基于正样本的响应图选择策略,以选择最匹配的响应图来减少信息冗余。
技术关键词
视觉特征
图像分割方法
多模态特征融合
图像分割网络
文本编码器
图像编码器
表达式
样本
跨模态
标签
矫正方法
解码器
计算机视觉
模块
锚点
对象
系统为您推荐了相关专利信息
图像检索模型
图像检索方法
图文
计算机可执行指令
三元组
图像分割网络
遥感图像数据
驱动特征
多任务损失函数
遥感影像分割
医学图像分割方法
预训练模型
编码器
医学图像分割系统
分支
分布式光伏电站
模型压缩
聚类算法
特征提取模块
长短期记忆模型
多模态信息融合
无线电
识别方法
射频扫描技术
多模态特征融合