摘要
本申请涉及计算机视觉技术领域,提供了一种图像分割方法、装置、电子设备及可读存储介质。该方法包括:通过利用文本查询增强模块对图像特征和文本特征进行特征融合,并对融合后的特征进行特征增强得到文本查询增强特征;利用目标编码器对图像特征和文本查询增强特征进行融合编码,得到目标编码特征;利用目标解码器对目标编码特征和文本查询增强特征进行融合解码,得到目标解码特征;根据目标解码特征和文本查询增强特征对所述输入图像进行分割,得到所述输入图像的分割结果。本申请能够更准确地模拟视觉和语言信息的全局上下文,从而在复杂场景下的图像分割任务中实现更优的性能,达到更好的分割效果。
技术关键词
文本
注意力
编码特征
解码模块
编码模块
融合特征
图像分割方法
解码器
编码器
多层感知机层
图像分割装置
计算机视觉技术
跨模态
电子设备
可读存储介质
系统为您推荐了相关专利信息
降水估测方法
相控阵雷达
雨量计
反射率数据
X波段
设备运行状态信息
多源融合
故障特征提取
机械故障诊断
通道注意力机制