基于多模态自适应融合的海关违禁品检测方法及系统

AITNT
正文
推荐专利
基于多模态自适应融合的海关违禁品检测方法及系统
申请号:CN202510492962
申请日期:2025-04-18
公开号:CN120411705A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开一种基于多模态自适应融合的海关违禁品检测方法及系统,包括:获取海关通关图像‑文本对,并提取海关通关图像的包括多尺度特征的原始特征,分别对浅层特征和深层特征加权融合后生成浅层融合特征和深层融合特征,对深层融合特征经多尺度池化操作后得到池化特征,将浅层融合特征、深度融合特征和池化特征拼接生成增强特征,将增强特征和原始特征整合后得到视觉特征;将视觉特征与文本特征进行模态对齐,对检测模型进行两阶段训练,由此得到违禁品检测结果。设计自适应动态通道融合模块,从多层隐藏状态中整合浅层细节和深层语义,通过自适应权重优化特征表达,实现低层细节与深层语义的有效融合,提高复杂场景下的特征分辨能力。
技术关键词
违禁品检测方法 融合特征 视觉特征 语言编码器 特征加权融合 池化特征 多尺度特征 答案 文本 违禁品检测系统 多模态特征 图像 两阶段 指令 多尺度池化 计算机 处理器 模板组合
系统为您推荐了相关专利信息
1
一种基于自适应卷积的退化文档图像二值化方法和系统
退化文档图像 卷积网络模型 标签 卷积模块 二值化系统
2
一种多模态图像融合方法、系统、介质及设备
可见光图像 多模态图像融合模型 基础 特征提取对图像 解码器
3
一种基于联邦视觉语言模型的遥感图像生成方法
图像生成方法 语言编码器 编码向量 注意力 文本
4
通过嵌入式视觉压缩实现的紧凑多模态大模型
视觉特征 嵌入式视觉 查询特征 紧凑型 文本
5
基于UE5像素回读与OpenCV的渲染异常自动化诊断系统
自动化诊断系统 双缓冲机制 像素 智能分析决策 频率分析方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号