摘要
本申请提供一种基于强化学习的异常检测多模态大模型训练方法和装置。本申请提供的方法:异常检测多模态大模型的编码器基于交叉注意力机制提取综合特征,基于综合特征预测样本图像与检测指令对应的异常标签和推理过程文本;计算推理过程文本的每个最小文本单元的交叉注意力矩阵和每个最小文本单元对应的解码器与检测指令之间的注意力矩阵;计算推理过程文本在样本图像上的综合分布情况;基于综合分布情况和异常标签的内容生成约束综合分布情况分布的奖励函数,基于所述奖励函数训练所述异常检测多模态大模型。本申请提供的基于强化学习的异常检测多模态大模型训练方法和装置,能够降低标注成本,提升异常检测的泛化性和解释性。
技术关键词
文本
多模态
模型训练方法
交叉注意力机制
矩阵
解码器
标签
样本
指令
模型训练装置
输入模块
编码器
元素
图像块
数值
关系
通道
系统为您推荐了相关专利信息
编码器模块
频域特征提取
级联
多模态
浅层特征提取
纤维复合材料
分布预测方法
图像编码器
闭环反馈机制
缺陷分类器
档案管理方法
灰狼优化算法
上下文特征
档案管理系统
数据存储格式