摘要
本发明公开了一种基于提示反向学习的医学图像分类方法、装置及介质,包括获取数据集,定义图像和类别的映射关系;构建对比文本‑图像对的预训练模型,提取自然图像的视觉特征;在图像编码器中加入提示后,提取医学图像的视觉特征;构建反向学习损失函数;将提示输入通过预训练模型的文本编码器,得到文本特征;构建损失函数,得到基于任务的目标函数;利用梯度下降法对预训练模型的图像编码器中的提示进行训练,并计算更新提示权重,迭代多次得到训练完成的提示,对医学图像进行分类,完成医学图像分类任务。本发明通过建立医学图像与自然图像之间的联系,从而提高自然图像预训练模型泛化到医学图像分类任务的能力和鲁棒性。
技术关键词
医学图像分类方法
注意力模型
图像编码器
视觉特征
文本编码器
图像类别
医学图像数据集
预训练模型
图像块
多层感知机
处理器
定义
线性
矩阵