摘要
本发明提供一种自由文本引导的遥感图像指代分割方法和系统,包括:构建包括图像、文本和各种标签的数据样本,输入并训练区域关系驱动图文分割模型,模型包括的动态关联视觉编码器,对图像进行多尺度感知与动态响应增强,生成多尺度视觉特征;像素级解码器,对进行像素级解码输出图像掩码信息;上下文关联文本编码器,对文本进行语义建模生成属性‑对象信息;区域关系建模模块,对和分别进行区域‑视觉和区域‑语言建模交互,得到区域过滤器和区域关联特征;目标导向联合解码器,对、和进行联合解码,实现模型的多头预测输出。本发明可以对遥感图像进行分割。
技术关键词
关系建模
文本编码器
区域滤波器
解码器
视觉特征
像素
多尺度感知
分割方法
标签
语义
图文
空间结构信息
遥感图像数据
自然语言
前馈神经网络
注意力
矩阵
系统为您推荐了相关专利信息
知识图谱构建方法
医学知识图谱
文本
医学专用
多模态
品质评估方法
全景图像数据
局部视觉特征
全局视觉特征
语义分割模型
高精度三维重建方法
采样点
高频特征
关键帧
语义
锂离子电池储能系统
状态监测方法
分类器模型
极限学习机算法
特征提取模型