摘要
本申请公开了一种缺陷热图生成方法、装置、设备及存储介质,涉及图像处理技术领域,该方法包括:基于待检测工件图像对应的视觉特征向量和自然语言查询语句对应的语言特征向量生成融合特征序列;通过多头注意力机制基于融合特征序列生成多头跨模态注意力矩阵;通过预设能量调整归一化算法对多头跨模态注意力矩阵进行归一化处理,获得归一化权重;基于归一化权重生成显著度向量,显著度向量用于表征待检测工件图像中各位置与自然语言查询语句之间的显著性程度;基于显著度向量对应的显著特征图生成目标缺陷证据热图。应用上述技术方案,解决了现有技术中的热图生成方法容易因注意力能量分配不当而导致热图定位精度不足的技术问题。
技术关键词
热图生成方法
跨模态
归一化算法
融合特征
自然语言
语句
多头注意力机制
工件
视觉
矩阵
注意力模型
热图生成装置
双线性插值
像素
序列
图像分割
归一化模块
对齐方法
系统为您推荐了相关专利信息
综合管理装置
自然语言
多模态数据融合
图像多模态
模型剪枝
自然语言文本
知识提取方法
逻辑
大语言模型
医疗辅助系统
自然语言
非暂态计算机可读存储介质
规划
语句
界面
活动识别方法
双频段
残差神经网络
多任务联合训练
融合特征