摘要
本发明公开了一种基于视觉‑语言模型的极地海冰语义分割方法,通过语言指定海冰分割区域,包括:获取可见光极地海冰数据集;利用视觉‑语言模型对所述可见光极地海冰数据集进行编码,获取文本嵌入向量和图像嵌入向量;融合所述文本嵌入向量和图像嵌入向量,获取图像语义信息和文本语义信息;基于所述文本语义信息,对所述图像语义信息进行解码,获取极地海冰分割掩码。本发明能够更灵活的对目标区域进行选择分割,更加准确高效的实现对不同种类的冰进行分割。另外,通过文本与图像的相互注意力机制的计算,使得文本能够与图像进行相互融合,能够准确的利用文本描述挑选并分割对应的图像区域。
技术关键词
极地海冰
图像嵌入
语义分割方法
可见光
视觉
语义关联度
注意力机制
数据
空间特征提取
文本编码器
上采样
模块
解码器
破冰船
系统为您推荐了相关专利信息
数控机床
轨迹模型
校正方法
激光位移传感器
三维坐标信息
茶芽长度
线性回归模型
管理方法
图像处理算法
移动设备
高空焊接作业
曲臂机构
无线控制模块
触摸式控制器
行走式
航空发动机叶片
缺陷检测方法
关键区域信息
样本
加权特征