即插即用提示驱动的可见光-热红外图像语义分割方法及系统

正文

推荐专利

申请号：CN202510403742

申请日期：2025-04-01

公开号：CN120411499A

公开日期：2025-08-01

类型：发明专利

摘要

本发明涉及多模态图像融合感知与场景理解技术领域，特别涉及一种即插即用提示驱动的可见光‑热红外图像语义分割方法及系统，通过双分支LoRA微调图像编码器分别提取输入的可见光图像和热红外图像的特征表示；将现有可见光‑热红外图像语义分割模型生成的分割掩膜转化为统一的提示信息，包括边界框提示或点提示；利用提示编码器将提示信息编码为提示嵌入；基于提示的掩码解码器通过空间通道交叉注意机制将图像特征表示和提示嵌入特征融合，经过分类头生成最终的分割掩码；在训练阶段，对真值掩码的提示添加参数化随机扰动，模拟预测提示的误差分布。本发明实现无需重新训练即可适配多种分割模型的高精度语义分割，显著提升复杂场景下的分割鲁棒性。

技术关键词

图像语义分割方法图像语义分割模型图像编码器可见光图像分支编码模块场景理解技术注意力解码器融合特征通道机制上采样矩阵计算机装置掩膜

系统为您推荐了相关专利信息

基于可见光与红外图像融合的电缆异常检测方法

电缆异常检测多元线性回归模型深度学习算法多模态可见光图像

一种基于双输入融合网络跨模态肾癌病理升级的分类方法

肾癌高层语义特征特征提取模块非线性分类方法

一种基于深度学习的风机叶片智能监测及优化方法

疲劳特征强化学习模型综合评价体系策略卷积特征提取

一种栏舍粪污检测方法及智能栏舍粪污清洁机器人

加权特征多头注意力机制学习特征分支清洁机器人

一种穿刺辅助方法、系统及电子设备

穿刺辅助系统穿刺辅助方法导板引导穿刺针三维模型

即插即用提示驱动的可见光-热红外图像语义分割方法及系统

站点导航

APP 下载