一种基于交叉注意力的图文模态废钢金属元素检测系统

AITNT
正文
推荐专利
一种基于交叉注意力的图文模态废钢金属元素检测系统
申请号:CN202411518015
申请日期:2024-10-29
公开号:CN119380873B
公开日期:2025-12-30
类型:发明专利
摘要
本发明涉及金属元素检测技术领域,公开一种基于交叉注意力的图文模态废钢金属元素检测系统,包括图像获取模块、文本获取模块、数据预处理模块、数据集划分模块、图像特征提取模块、文本特征提取模块、交叉注意力机制模块、特征融合模块、分类器模块、模型评估与优化模块、金属元素数据库、结果输出模块、系统部署与应用模块。通过引入交叉注意力机制,能有效融合视觉和文本特征,使得模型在处理相似外观的金属时,依赖于图像特征的同时能利用文本特进行区分,显著提高识别准确性,且系统能充分利用图像模态和文本模态的信息,使得模型能更全面、深入地分析废钢特性,提升分类效果。
技术关键词
交叉注意力机制 文本 高维特征向量 图像特征提取 图文 图像获取模块 特征提取模块 数据收集单元 分类器 输出模块 训练集 卷积神经网络提取 元素 高清摄像设备 融合视觉
系统为您推荐了相关专利信息
1
数据库测试用例生成与优化方法、系统、设备和存储介质
大语言模型 文本 语义向量 模块 数据库服务器
2
网络安全模型训练方法、装置、计算机设备及存储介质
模型训练方法 文本 样本 标签文件 语义
3
一种基于CLIP模型的零样本工业瑕疵检测方法
嵌入特征 视觉特征 文本编码器 异常状态 瑕疵检测方法
4
一种集中采购供应商智能判断方法及系统
智能判断方法 综合评价指标 数据 附加值 决策
5
融合大模型的多模态行人指挥手势识别方法
手势识别方法 文本编码器 人体关键点 多模态手势 行人检测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号