摘要
本申请提供一种注意力损失引导的异常检测多模态大模型训练方法和装置。本申请提供的方法:输入样本图像和异常检测提问文本至异常检测多模态大模型;异常检测多模态大模型基于跨模态注意力机制提取融合特征,基于融合特征预测样本图像的推测标签和推理过程文本;获取与样本图像对应的标识异常区域的掩码参考图像;根据样本图像对应的参考标签和掩码参考图像确定分布特征;根据分布特征计算跨模态注意力机制的注意力损失;以注意力损失作为损失函数,训练异常检测多模态大模型,使训练后的异常检测多模态大模型对应的注意力热图服从分布特征。本申请提供的注意力损失引导的异常检测多模态大模型训练方法和装置,用以提升异常检测的准确性。
技术关键词
分布特征
多模态
注意力机制
跨模态
模型训练方法
融合特征
样本
标签
文本编码器
图像编码器
矩阵
模型训练装置
输入模块
图像特征提取
图像块
标识
系统为您推荐了相关专利信息
应急响应方法
动态掩膜
多模态
外玻璃幕墙
偏振态
挖掘知识图谱
多层感知机
生成数据集
药物结构
关系
风电场环境
应对自然灾害
深度学习模型
注意力机制
跨模态
快速识别方法
分辨率
红外光谱特征
特征提取模块
注意力机制
视觉里程计方法
特征点
卷积特征
光照
光流跟踪算法