一种用于RGB-D语义分割的多模态引导融合方法

正文

推荐专利

申请号：CN202510549098

申请日期：2025-04-28

公开号：CN120580543A

公开日期：2025-09-02

类型：发明专利

摘要

一种用于RGB‑D语义分割的多模态引导融合方法，属于计算机视觉领域。本发明实现方法为：基于RGB数据训练单模态分割教师模型，引导RGB‑D多模态模型完成RGB图像与深度图像的融合；使用Segformer网络作为单模态分割教师模型；对于RGB‑D多模态学生网络训练，引入单模态分割教师网络，基于教师网络预测分割掩码与分层特征的预测级和特征级双重引导，使学生网络融合RGB信息与深度信息时保留RGB图像更丰富的语义信息；基于单模态分割教师网络预测分割掩码与分层特征的预测级和特征级双重引导，引入加权策略，与RGB‑D多模态学生网络训练交叉熵损失结合，反向传播更新学生网络参数，保障模态信息交互有效性，提升RGB‑D多模态学生网络分割效果。

技术关键词

融合方法教师分层特征学生网络多分辨率语义表达式图像模态特征解码器重构模块注意力编码器全局平均池化有效性通道冗余特征融合策略

系统为您推荐了相关专利信息

一种ADHD儿童认知训练系统

认知训练系统注意力波动特征眼动轨迹儿童

一种基于血清代谢指纹谱图的烟雾病差异代谢物生物标志物组合的筛选方法及标志物组合

激光解吸电离飞行时间质谱生物标志物指纹谱图血清傅里叶变换离子回旋共振质谱仪

基于神经网络的汽车故障码可视化方法、装置、终端及存储介质

可视化方法多项式读取配置文件训练器非临时性计算机可读存储介质

一种面向设施农业的无线传感器网络节点部署方法

设施农业覆盖率表达式通信节点重叠覆盖区域

一种基于神经网络的TE-TM极化模式识别方法及系统

模式识别方法大地电磁数据模式识别系统地球物理探测技术 Softmax函数

一种用于RGB-D语义分割的多模态引导融合方法

站点导航

APP 下载