摘要
本发明公开了计算机视觉技术领域的一种基于跨模态协同优化的电力设备RGB‑T图像语义分割方法、终端及介质,方法包括:获取变电站RGB图像及红外图像;将配准后的图像输入编码器,进行特征提取得到多尺度特征;将多尺度特征输入正、反向金字塔结构进行语义加强,得到语义加强后的多尺度特征;将语义加强后的多尺度特征分别输入高层特征融合模块、中层特征融合模块以及低层特征融合模块进行特征融合,得到融合特征;将融合特征输入正、反向金字塔结构进行语义加强,得到语义加强后的融合特征;将语义强化后的融合特征输入解码器进行解码,得到语义分割结果。本方法提升了对电力设备分割任务的适配性和性能,最终可输出精确的语义分割结果。
技术关键词
图像语义分割方法
融合特征
金字塔结构
电力设备
跨模态
多尺度特征
输入解码器
红外图像特征
注意力
元素
可见光图像
模块
上采样
变电站场景
输出特征
计算机视觉技术
信息处理
系统为您推荐了相关专利信息
电子信息识别方法
分类识别模型
融合特征
多模态传感器
数据分类识别
跨模态数据
表面检测方法
检测网络模型
构建文件目录结构
图像
数字病理切片
组织病理图像
节点特征
输出特征
特征提取模块
特征提取模块
深度特征提取
影像
融合特征
残差神经网络
SLIC算法
室内定位方法
信道状态信息
节点
像素块