摘要
本发明公开了一种基于多模态模型的GUI异常检测方法,包括:S1,设计多模态模型架构,用于融合文字模态和图像模态的特征;S2,在正常UI数据集上让模型学习到不同类型的组件和文字的匹配,和一些常见类型的UI异常的图文匹配能力,使得模型具有few shot能力;S3,对基于用户使用DSL定义的异常生成的小量数据集,进行few‑shot的模型微调,使得模型拥有识别新种类UI异常的能力;S4,使用文字提示和多模态模型进行UI异常的检测。本方法包括如何构建具有零样本和小样本迁移能力的多模态模型以及如何使用多模态模型进行GUI异常检测,本发明仅需在小样本数据集上微调模型,便可达到很好的GUI异常检测效果。
技术关键词
异常检测方法
多模态
文字编码器
图像编码器
矩阵
文字特征
异常数据
图像特征向量
图片
注意力
模态特征
样本
模块
双模态
图文
输出特征
元素
系统为您推荐了相关专利信息
语义
文本编码器
特征提取模块
互联网视频平台
注意力
传感器
MLP神经网络
电力变压器
数据
智能校准方法
检测网络模型
多头注意力机制
加速器
处理单元
模块
检测元件
字符识别模型
异常检测方法
图像
计算机视觉技术