摘要
本发明提出一种基于多模态注意力机制的医学影像自监督诊断方法,该方法包括:对原始多模态医学影像依次进行数据标准化、配准对齐与切片处理,得到二维切片图像集合,将二维切片图像分别经过MAE自监督学习与DINO自监督学习,以得到各模态预训练编码器,将二维切片图像依次经过各模态预训练编码器与注意力机制优化处理,以得到融合特征表示,并通过任务特定的解码器处理,以得到最终的诊断结果。本发明结合MAE和DINO两种自监督学习方法,通过随机遮挡图像部分区域并训练模型重建缺失部分,以及对比不同增强视图之间相似度进行自蒸馏训练,有效提取出具有判别性的全局和局部特征,提高了模型的学习效果。
技术关键词
多模态注意力
多模态医学影像
切片
融合特征
图像块
诊断方法
解码器
编码器
注意力机制
图像分割
模态特征
像素
多层感知机
图像重建
矩阵
序列
系统为您推荐了相关专利信息
管道泄漏检测方法
静态特征
预测管道泄漏
融合特征
样本
多维特征数据
光伏功率预测方法
卫星遥感数据
加权特征
光伏发电系统
延展机
策略优化模型
特征提取网络
分类器
图像特征提取
识别分析系统
面部特征识别
多模态数据融合
深度图像数据
数据采集同步