摘要
本发明提出了一种基于不同时相遥感图像的变化文本生成方法,贯通计算机视觉(CV)与自然语言处理(NLP)两个领域。首先,通过均值归一化和高斯滤波消除噪声,并进行仿射配准保证几何一致性;随后在多尺度金字塔下对图像进行下采样、特征编码与上采样融合,兼顾宏观结构与细节信息;在此基础上,利用ResNeSt分裂注意力、空洞空间金字塔池化、Criss‑Cross注意力和Shuffle注意力模块,对融合特征进行多重增强,以突出关键变化区域;然后通过正弦—余弦位置编码和跨时相差分特征注入多层状态空间模型,实现时序信息的深度交互和融合;最后采用交叉熵与L2正则化损失、Adam优化器及混合精度训练策略。该方法能够高效检测遥感图像中细微变化并生成语义准确的文字描述。
技术关键词
遥感图像变化
文本生成方法
状态空间模型
融合特征
空间金字塔池化
全局平均池化
图像特征提取
多尺度
消除噪声
通道
图像配准
计算机视觉
编码
注意力机制
语义特征
模块
自然语言