摘要
本发明涉及多模态计算机视觉领域,具体为一种多模态数据融合的实时语义分割与目标检测联合模型。该模型通过以下技术手段实现:基于RGB图像、深度信息及激光雷达数据,设计多分支网络分别提取不同模态特征;引入动态模态选择模块,根据环境条件自动选择最优的模态组合,提升模型在复杂场景下的自适应能力;利用UAFM特征融合模块实现跨模态信息互补;通过逐级解码结构,逐步融合多尺度特征以平衡细节与全局语义信息;采用联合训练机制,同步输出语义分割结果和目标检测框,减少计算冗余。本发明在多模态数据支持下显著提升复杂场景下的分割与检测精度;通过动态模态选择与特征共享,实现高效实时处理,推理速度较独立模型提升30%以上。
技术关键词
多模态数据融合
语义
互补特征
多任务损失函数
融合特征
多尺度信息
模态特征
注意力
特征提取模块
Softmax函数
融合多尺度特征
跨模态
多尺度特征融合
上采样
区域建议网络
解码模块
激光雷达点云
激光雷达数据
全局平均池化
系统为您推荐了相关专利信息
指令响应方法
大语言模型
上下文感知方法
特征权重学习
视角
血流动力学参数
图像分割模型
交叉注意力机制
混合损失函数
分支