摘要
本发明公开了一种城市内涝受灾状态检测模型的构建方法及应用,属于计算机视觉技术领域;首先通过图像编码模块提取训练样本对中城市图像的高维度视觉特征,即图像编码特征,通过嵌入层提取描述该城市图像中内涝受灾状态的真实文本的嵌入特征;而后在图像解码模块中基于交叉注意力机制对图像编码特征和文本嵌入特征进行融合,提高了图像和文本之间的关联,促进了不同模态之间的深层次交互,使得视觉模态信息和文本模态信息在特征空间上得到了有效的融合,丰富了语义层面的细粒度信息,提高了城市内涝受灾状态检测模型对复杂洪涝场景的理解能力,能够对复杂的城市场景进行准确的内涝受灾状态检测。
技术关键词
图像编码
文本
解码模块
图像特征提取
嵌入特征
融合特征
编码器
多模态
预训练语言模型
解码器
训练样本集
标记
交叉注意力机制
状态检测方法
计算机视觉技术
级联
语义层面
计算机程序产品
系统为您推荐了相关专利信息
数据融合方法
跨模态
文本处理模型
元学习算法
图像处理模型
文本识别模型
文本识别方法
指令
参数
文本识别系统