摘要
本发明涉及金属元素检测技术领域,公开一种基于交叉注意力的图文模态废钢金属元素检测系统,包括图像获取模块、文本获取模块、数据预处理模块、数据集划分模块、图像特征提取模块、文本特征提取模块、交叉注意力机制模块、特征融合模块、分类器模块、模型评估与优化模块、金属元素数据库、结果输出模块、系统部署与应用模块。通过引入交叉注意力机制,能有效融合视觉和文本特征,使得模型在处理相似外观的金属时,依赖于图像特征的同时能利用文本特进行区分,显著提高识别准确性,且系统能充分利用图像模态和文本模态的信息,使得模型能更全面、深入地分析废钢特性,提升分类效果。
技术关键词
交叉注意力机制
文本
高维特征向量
图像特征提取
图文
图像获取模块
特征提取模块
数据收集单元
分类器
输出模块
训练集
卷积神经网络提取
元素
高清摄像设备
融合视觉
系统为您推荐了相关专利信息
嵌入特征
视觉特征
文本编码器
异常状态
瑕疵检测方法
手势识别方法
文本编码器
人体关键点
多模态手势
行人检测模型