一种基于大模型适配的事件-RGB语义分割方法

正文

推荐专利

申请号：CN202410831267

申请日期：2024-06-26

公开号：CN118823342B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于大模型适配的多模态语义分割方法，首先对于每一对的输入数据，以RGB数据的曝光时间戳为基准，以不同的时间尺度划分事件信息，随后将事件处理为体素，和视频帧分别输入多时空尺度事件嵌入模块与SAM主干，然后将经过多时空尺度事件嵌入模块提取的时间特征输入SAM事件适配器中，与SAM中的图像信息进行交互，得到富含高质量运动信息的特征。最后特征将被输入简单的语义分割头来生成语义分割结果。本发明是端到端的，整体可以直接进行训练，之后可以使用训练的模型来处理事件‑RGB场景下的语义分割问题。本发明解决了由于RGB信息在极端场景下信息丢失的问题，并达到了比以往工作更优秀的语义分割结果。

技术关键词

语义分割方法注意力多时空尺度事件特征适配器数据编码模块语义特征线性 Sigmoid函数图像模态特征补丁检测头更新网络参数矩阵网格

系统为您推荐了相关专利信息

医用器械消毒追溯管理系统

医用器械消毒追溯管理系统医疗器械零知识证明协议分布式文件系统

一种基于扩散模型和注意力机制的序列推荐方法

序列推荐方法注意力机制中文命名实体识别方法随机噪声噪声样本

一种基于多模态大模型的船舶与海洋工程辅助设计方法

工程图纸船舶辅助设计方法文本多头注意力机制

一种人工神经网络级联知识放大方法、装置、系统和介质

人工神经网络级联适配器数据注意力机制

一种基于大模型的自动化数据标注系统及方法

数据标注系统多维度分类标签模块动态数据拆分语义

一种基于大模型适配的事件-RGB语义分割方法

站点导航

APP 下载