摘要
本发明涉及一种基于多模态提示的遥感图像指代分割方法及系统,属于计算机视觉与遥感智能解译技术领域。该方法包括:S1:数据预处理:划分遥感图像指代分割数据集;S2:构建基于多模态提示的遥感图像指代分割模型,包括图像编码器、空间先验模块、文本编码器、细粒度视觉语言交互器和多模态提示编码器;S3:训练基于多模态提示的遥感图像指代分割模型:对于遥感图像指代分割模型的训练,使用Focal损失、交叉熵损失和Dice损失三者结合的损失函数对模型优化训练;S4:输出分割结果:将待分割遥感图像输入到训练好的模型中,然后将模型输出结果输入到掩码解码器中,完成对目标物体的指代分割。本发明提升了解译效率。
技术关键词
多模态
文本编码器
分割方法
图像编码器
解码器
视觉
图像空间信息
多尺度特征融合
自然语言文本
图像分割模型
解译技术
物体
代表
表达式
理解系统
分析模块
系统为您推荐了相关专利信息
液位传感器
抽水泵
时间差
上水控制方法
真空破坏阀
诊断系统
多模态医学影像
多模态特征融合
跨模态
条件生成对抗网络
智能多媒体互动教学
考核方法
异常状态
画像
语义分析方法