一种多模态数据融合的实时语义分割与目标检测联合模型

正文

推荐专利

申请号：CN202510686329

申请日期：2025-05-27

公开号：CN120635406A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及多模态计算机视觉领域，具体为一种多模态数据融合的实时语义分割与目标检测联合模型。该模型通过以下技术手段实现：基于RGB图像、深度信息及激光雷达数据，设计多分支网络分别提取不同模态特征；引入动态模态选择模块，根据环境条件自动选择最优的模态组合，提升模型在复杂场景下的自适应能力；利用UAFM特征融合模块实现跨模态信息互补；通过逐级解码结构，逐步融合多尺度特征以平衡细节与全局语义信息；采用联合训练机制，同步输出语义分割结果和目标检测框，减少计算冗余。本发明在多模态数据支持下显著提升复杂场景下的分割与检测精度；通过动态模态选择与特征共享，实现高效实时处理，推理速度较独立模型提升30％以上。

技术关键词

多模态数据融合语义互补特征多任务损失函数融合特征多尺度信息模态特征注意力特征提取模块 Softmax函数融合多尺度特征跨模态多尺度特征融合上采样区域建议网络解码模块激光雷达点云激光雷达数据全局平均池化

系统为您推荐了相关专利信息

一种基于知识融合的检索增强语义指令响应方法

指令响应方法大语言模型上下文感知方法特征权重学习视角

一种肺动脉血流动力学参数预测方法及系统

血流动力学参数图像分割模型交叉注意力机制混合损失函数分支

基于分布式向量数据库的相似事件识别方法及系统

事件识别方法客户端序列服务端语义向量

泊车地面目标语义分割数据合成方法、系统及介质

泊车场景地面影像标签图像修复模型

多源异构资金数据的处理方法及系统

列式存储数据资金字段融合知识图谱异构

一种多模态数据融合的实时语义分割与目标检测联合模型

站点导航

APP 下载