摘要
本发明公开一种基于多模态自适应融合的海关违禁品检测方法及系统,包括:获取海关通关图像‑文本对,并提取海关通关图像的包括多尺度特征的原始特征,分别对浅层特征和深层特征加权融合后生成浅层融合特征和深层融合特征,对深层融合特征经多尺度池化操作后得到池化特征,将浅层融合特征、深度融合特征和池化特征拼接生成增强特征,将增强特征和原始特征整合后得到视觉特征;将视觉特征与文本特征进行模态对齐,对检测模型进行两阶段训练,由此得到违禁品检测结果。设计自适应动态通道融合模块,从多层隐藏状态中整合浅层细节和深层语义,通过自适应权重优化特征表达,实现低层细节与深层语义的有效融合,提高复杂场景下的特征分辨能力。
技术关键词
违禁品检测方法
融合特征
视觉特征
语言编码器
特征加权融合
池化特征
多尺度特征
答案
文本
违禁品检测系统
多模态特征
图像
两阶段
指令
多尺度池化
计算机
处理器
模板组合
系统为您推荐了相关专利信息
退化文档图像
卷积网络模型
标签
卷积模块
二值化系统
可见光图像
多模态图像融合模型
基础
特征提取对图像
解码器
自动化诊断系统
双缓冲机制
像素
智能分析决策
频率分析方法