摘要
本发明提供了一种基于序贯三支掩码和注意力融合的Transformer解释方法,属于人工智能可解释性技术领域。解决了Transformer模型解释困难导致难以投入现实应用的技术问题,其技术方案为:首先将图像输入标准的Transformer模块,保存每一层编码器层的注意力矩阵,并聚合生成关系矩阵;接下来取出最终编码器层输出,重塑并上采样作为掩码放入掩码集;接着利用序贯三支决策选出积极掩码集,并获取初步解释结果;最后,将第一步聚合的生成关系矩阵与初步解释结果融合生成最终解释结果。本发明的有益效果为:解释效果好,对自然图像和医学图像均可得到较好的解释结果,帮助人类理解深度学习模型。
技术关键词
注意力
编码器
序贯三支决策
图像块
生成关系
物体位置信息
投影变换矩阵
深度学习模型
信息编码
模块
语义
上采样
线性
尺寸
医学
网格
系统为您推荐了相关专利信息
调频
储能
多头注意力机制
门控循环单元
聚类算法
跨模态融合特征
融合控制方法
多模态数据融合
预训练语言模型
多任务联合训练
水体识别方法
多源遥感影像
雷达
深度特征提取
特征提取模型
直播方法
注意力
区域卷积神经网络
场景分类
参数