摘要
本发明公开一种全极化合成孔径雷达与可见光图像文字描述方法,包括采集全极化合成孔径雷达图像和可见光图像;对图像进行李氏滤波去噪处理,再将多个极化通道特征融合后输入视觉变换器编码器进行特征提取,对可见光图像进行多层变换器特征提取;对可见光图像和合成孔径雷达图像各自的多层特征进行加权融合,将融合后的多模态特征输入文本到文本迁移变换器模型文字编码器生成自然语言描述。该方法通过深度学习技术充分发挥全极化合成孔径雷达与可见光图像的互补优势,实现多模态特征的动态融合与语义交互,显著提升了遥感图像自动文字描述的准确性和鲁棒性,适用于复杂环境下的多模态遥感图像分析与理解。
技术关键词
可见光图像
强化学习策略
融合特征
变换器模块
文字编码器
合成孔径雷达图像
注意力机制
预训练模型
梯度算法
文本
生成自然语言
分层特征
跨模态
系统为您推荐了相关专利信息
生成模型训练方法
上采样
多尺度特征融合
密度
分析CT图像
行人跌倒检测方法
检测行人
融合特征
网络
融合器
语义分割方法
深层特征提取
浅层特征提取
高分辨率遥感图像
解码器