基于序贯三支掩码和注意力融合的Transformer解释方法

正文

推荐专利

申请号：CN202411133754

申请日期：2024-08-19

公开号：CN119152253A

公开日期：2024-12-17

类型：发明专利

摘要

本发明提供了一种基于序贯三支掩码和注意力融合的Transformer解释方法，属于人工智能可解释性技术领域。解决了Transformer模型解释困难导致难以投入现实应用的技术问题，其技术方案为：首先将图像输入标准的Transformer模块，保存每一层编码器层的注意力矩阵，并聚合生成关系矩阵；接下来取出最终编码器层输出，重塑并上采样作为掩码放入掩码集；接着利用序贯三支决策选出积极掩码集，并获取初步解释结果；最后，将第一步聚合的生成关系矩阵与初步解释结果融合生成最终解释结果。本发明的有益效果为：解释效果好，对自然图像和医学图像均可得到较好的解释结果，帮助人类理解深度学习模型。

技术关键词

注意力编码器序贯三支决策图像块生成关系物体位置信息投影变换矩阵深度学习模型信息编码模块语义上采样线性尺寸医学网格

系统为您推荐了相关专利信息

基于大模型数据驱动图卷积网络的城市群热区预测方法

动态邻接矩阵行程语义特征数据资源分配

一种储能调频市场参与方法、系统、设备及介质

调频储能多头注意力机制门控循环单元聚类算法

多模态数据融合控制方法、装置、设备及介质

跨模态融合特征融合控制方法多模态数据融合预训练语言模型多任务联合训练

一种基于深度学习的多源遥感影像水体识别方法及系统

水体识别方法多源遥感影像雷达深度特征提取特征提取模型

基于场景识别的8K智能慢直播方法及系统

直播方法注意力区域卷积神经网络场景分类参数

基于序贯三支掩码和注意力融合的Transformer解释方法

站点导航

APP 下载