摘要
本发明公开了一种用于事件图像多模态语义分割的跨模态融合网络MDAFNet。该网络包括自适应事件特征融合模块、模态自适应重标定模块和多头门控融合模块。通过多尺度活动建模、注意力机制及门控引导融合,有效提升事件数据的语义质量,增强不同模态特征的鲁棒性与表达能力,实现全局上下文信息交互。实验表明,该方法在多数据集上具备领先性能,适用于智能监控、自动驾驶等视觉任务。
技术关键词
图像处理网络
事件特征
注意力机制
动态场景
抑制背景噪声
图像多模态
校准
生成多尺度
跨模态
全局平均池化
模块
多模态特征
语义
多尺度特征
交互特征