基于参数调优和多模态数据融合的语义分割方法

正文

推荐专利

申请号：CN202411561562

申请日期：2024-11-04

公开号：CN119785018A

公开日期：2025-04-08

类型：发明专利

摘要

本发明涉及计算机视觉与深度学习领域，提出了一种基于参数调优和多模态数据融合的语义分割方法。本方法的核心在于充分融合RGB、深度和Mask三种模态数据，以提高分割精度，采用冻结的SegFormer编码器并行提取特征，结合参数调优模块以实现室内语义分割任务适配，网络前两层通过Gate门动态加权融合RGB和Mask特征来以增强边界信息，后两层则利用上下文信息交互模块提升特征语义信息表达能力，引入多模态交叉融合模块，采用高效的交叉注意力和改进的空间坐标注意力，确保深度信息与RGB特征有效交互和增强。本发明不仅减少了计算负担，提升了模型效率，还显著提高了室内场景语义分割的准确性，具有广泛的应用前景。

技术关键词

语义分割方法 RGB特征注意力编码器场景语义分割多模态参数模块阶段融合策略计算机视觉模态特征数据坐标元素动态通道负担核心

基于参数调优和多模态数据融合的语义分割方法

站点导航

APP 下载