摘要
本发明提出了一种基于视觉语言模型与交叉注意力机制的滑坡分类方法及系统。该方法及系统的具体内容包括:数据预处理:对RGB图像进行Canny边缘检测,对DEM计算坡度、坡向等地形属性;特征提取:采用反射填充卷积层和多尺度残差连接捕获局部特征;视觉语言模型引入:利用视觉语言模型通过图像‑文本对齐提取语义增强特征;交叉自注意力融合:通过自注意力捕捉全局上下文,交叉注意力聚焦异源数据互补信息;分类输出:利用全局平均池化和线性分类器输出结果。本发明通过视觉语言模型和交叉自注意力机制,有效提升复杂地形下的滑坡识别能力,为地质灾害监测提供了高效可靠的技术手段,可广泛应用于滑坡识别、风险评估等领域。
技术关键词
交叉注意力机制
分类方法
编码器模块
地形结构
图像
数据
分类系统
线性分类器
视觉特征
边缘检测
智能化监测系统
文本
语义
多模态特征融合
异源
预训练语言模型